PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation

PhaForce is een nieuw visueel-krachtbeleid dat contactrijke manipulatie verbetert door lage-frequentie planning en hoge-frequentie correctie te coördineren via een faseschema, wat resulteert in een succespercentage van 86% en superieure aanpassing aan geometrische variaties.

Mingxin Wang, Zhirun Yue, Renhao Lu, Yizhe Li, Zihan Wang, Guoping Pan, Kangkang Dong, Jun Cheng, Yi Cheng, Houde Liu

Gepubliceerd 2026-03-10
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een robot wilt leren om een lastige taak uit te voeren, zoals het inpluggen van een lader in een stopcontact of het vegen van een bord. Dit klinkt simpel, maar voor een robot is het een nachtmerrie. Waarom? Omdat robots vaak "blind" zijn voor het gevoel van aanraking. Ze zien dat de lader er is, maar ze weten niet of hij vastzit, of dat hij scheef zit, of dat hij net de rand raakt.

Deze paper introduceert PhaForce, een slimme manier om robots te leren om niet alleen te kijken, maar ook te voelen en te reageren op het juiste moment.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: De "Blinde" Robot

Stel je een robot voor die probeert een sleutel in een slot te steken.

  • De oude manier: De robot kijkt naar de camera, denkt "Ah, ik zie het slot!" en stuurt dan een bevel: "Draai je hand 5 graden naar links." Maar dit gebeurt langzaam. Tussen het kijken en het bewegen zit een kleine vertraging. Als de robot tegen de rand van het slot stoot, merkt hij dat pas te laat. Het resultaat? De robot blijft vastzitten of duwt te hard.
  • Het dilemma: Robots kunnen niet continu en snel nadenken (dat kost te veel rekenkracht), maar ze moeten wel snel reageren als ze iets voelen.

2. De Oplossing: PhaForce (De "Twee-Geest" Robot)

PhaForce lost dit op door de robot te splitsen in twee denkprocessen die samenwerken, net als een ervaren vakman met een assistent.

De "Trage Planner" (De Chef)

  • Wat doet hij? Hij kijkt naar de camera en de geschiedenis van krachten, en denkt na over het grote plaatje. "Oké, we zijn bij het stopcontact. Nu moeten we zoeken, dan passen, dan duwen."
  • Hoe vaak denkt hij na? Soms (bijvoorbeeld 6 keer per seconde). Hij maakt een "chunk" (een blokje) van bewegingen vooruit.
  • Het geheim: Hij gebruikt een dubbele poort. Hij laat kracht-sensoren alleen toe als het echt nodig is. Als de robot in de lucht zweeft (geen contact), negeert hij de trillingen van de motor. Zodra hij voelt dat hij raakt, schakelt hij de kracht-sensoren in.
  • Analogie: Dit is als een chef-kok die het recept schrijft. Hij zegt: "Nu bakken we de kip." Hij schrijft niet elke seconde een nieuwe instructie, maar geeft een plan voor de hele stap.

De "Snelle Corrector" (De Assistent)

  • Wat doet hij? Hij kijkt niet naar de camera, maar alleen naar de krachtmeters. Hij is hyper-alert.
  • Hoe vaak denkt hij na? Super snel (24 keer per seconde of meer).
  • Het geheim: Hij weet precies wanneer hij mag ingrijpen. Als de robot in de "zoek-fase" zit, mag hij alleen zijwaarts bewegen om het gat te vinden. Als de robot in de "duw-fase" zit, mag hij alleen naar beneden duwen. Hij doet niet zomaar wat; hij volgt een strakke regeling.
  • Analogie: Dit is de assistent die de kok helpt. Als de kip begint te verbranden (te veel kracht), grijpt de assistent direct in en draait de hitte lager, zonder dat de chef hoeft op te kijken. Als de kip nog niet gaar is, doet de assistent niets.

3. De "Fase-Bewust" Sensor (De Verkeersregelaar)

Het allerbelangrijkste nieuwe idee in deze paper is de Fase-voorspeller.
Stel je voor dat je een auto bestuurt. Je hebt andere regels als je op de snelweg zit dan als je in een parkeergarage rijdt.

  • De oude robots: Gebruikten kracht-sensoren altijd en overal. Dat is alsof je op de snelweg remt alsof je in een parkeergarage zit. Dat werkt niet.
  • PhaForce: Heeft een interne klok die zegt: "We zijn nu in de 'zoek-fase'." In deze fase mag de robot zijwaarts bewegen om het gat te vinden. Zodra de robot het gat vindt, schakelt de klok om naar de 'duw-fase'. Nu mag hij alleen nog maar naar beneden duwen.
  • Waarom is dit cool? Het voorkomt dat de robot in de verkeerde richting duwt. Als hij vastzit, probeert hij niet harder te duwen (wat het probleem verergert), maar trekt hij zich terug en probeert hij het opnieuw.

4. Wat levert dit op?

De onderzoekers hebben dit getest op echte robots met taken zoals:

  • Een lader inpluggen (waarbij de robot moet zoeken en niet vast moet komen te zitten).
  • Een lade openen (waarbij de robot moet voelen of de lade vastzit en dan voorzichtig moet trekken).
  • Een bord vegen (waarbij de robot precies de juiste druk moet houden: niet te hard, niet te zacht).

De resultaten:

  • De robots met PhaForce waren veel succesvoller (86% succes) dan de oude robots (slechts 38% succes).
  • Ze waren beter in het aanpassen aan onverwachte situaties (bijvoorbeeld als het bord iets hoger staat dan verwacht).
  • Ze deden de taken rustiger en met de juiste kracht, waardoor ze minder schade aanrichtten.

Samenvatting in één zin

PhaForce is als het geven van een robot een intuïtie: hij weet niet alleen wat hij moet doen (kijken), maar ook wanneer hij moet voelen en hoe hij moet reageren op basis van de situatie, net als een mens die een lastig puzzelstukje in een doos past zonder er te hard op te duwen.