PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation

Die Arbeit stellt PhaForce vor, einen phasengesteuerten visuomotorischen Ansatz, der durch die Kombination eines langsamen Diffusionsplaners und eines schnellen Korrektors kontaktreiche Manipulationsaufgaben mit einer durchschnittlichen Erfolgsrate von 86 % löst, indem er die visuelle Semantik bewahrt und gleichzeitig hochfrequente Kraft-Rückkopplung für präzise Anpassungen nutzt.

Mingxin Wang, Zhirun Yue, Renhao Lu, Yizhe Li, Zihan Wang, Guoping Pan, Kangkang Dong, Jun Cheng, Yi Cheng, Houde Liu

Veröffentlicht 2026-03-10
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie versuchen, einen Schlüssel in ein Schloss zu stecken oder einen Schwamm über eine Tafel zu wischen. Das klingt einfach, aber für einen Roboter ist das eine echte Herausforderung.

Das Problem: Der Roboter ist zu langsam und zu stur.

Bisherige Roboter-Intelligenzen arbeiten wie ein Fotograf, der nur alle paar Sekunden ein Foto macht und dann eine Bewegung plant. Wenn der Schlüssel aber hakt oder der Schwamm zu fest aufdrückt, passiert das in Millisekunden. Der Roboter sieht das auf dem nächsten Foto erst zu spät. Er reagiert dann oft falsch, weil er die Kraft, die auf seinen Fingern wirkt (den Widerstand), ignoriert oder falsch interpretiert.

Andere Roboter versuchen, auf Kraft zu reagieren, tun das aber oft wild und unkoordiniert – wie ein Autofahrer, der bei jeder kleinen Unebenheit das Lenkrad ruckartig herumreißt, statt sanft zu korrigieren.

Die Lösung: PhaForce – Der „Zwei-Gehirn"-Ansatz

Die Forscher haben PhaForce entwickelt. Man kann sich das wie ein Team aus zwei verschiedenen Denkern vorstellen, die perfekt zusammenarbeiten:

1. Der langsame Planer (Der Architekt)

Stellen Sie sich einen erfahrenen Architekten vor, der einen Bauplan erstellt. Er arbeitet ruhig und überlegt.

  • Was er macht: Er schaut sich die Bilder an (Vision) und plant die grobe Bewegung für die nächsten paar Sekunden.
  • Das Neue: Er ist nicht blind für Kraft. Aber er nutzt die Kraft nur, wenn es Sinn ergibt. Er fragt sich: „Bin ich gerade im freien Raum? Dann ignoriere ich das Wackeln. Bin ich gerade im Kontakt? Dann achte ich auf den Widerstand."
  • Die Analogie: Er ist wie ein Dirigent, der weiß, wann die Geige laut spielen soll und wann sie leise sein muss. Er plant den groben Takt.

2. Der schnelle Korrektor (Der Akkordeon-Spieler)

Stellen Sie sich einen virtuellen Akkordeon-Spieler vor, der auf der Bühne sitzt und sofort auf jede kleine Änderung im Raum reagiert.

  • Was er macht: Er arbeitet extrem schnell (viel schneller als der Planer). Er fängt kleine Fehler auf, die der Planer nicht sieht – wie ein winziges Haken des Schlüssels oder ein zu festes Aufdrücken.
  • Das Neue: Er weiß genau, wo er korrigieren darf. Wenn der Roboter gerade in ein Loch sucht, darf er nur links/rechts/oben/unten korrigieren, aber nicht drehen. Wenn er drückt, darf er nur nach unten korrigieren.
  • Die Analogie: Er ist wie ein Assistent, der dem Architekten zur Seite steht und sagt: „Hey, der Planer will nach links, aber wir stoßen gerade an! Ich schiebe jetzt ganz sanft nach rechts, damit wir nicht hängen bleiben."

3. Der Taktgeber (Der Phase-Vorhersager)

Das Herzstück von PhaForce ist ein kleiner „Taktgeber", der den beiden Gehirnen sagt, in welcher Phase des Auftrags sie sich befinden.

  • Die Analogie: Stellen Sie sich vor, Sie spielen ein Videospiel. Es gibt Level 1 (Suchen), Level 2 (Einfügen) und Level 3 (Fertig). Der Taktgeber weiß genau: „Wir sind gerade in Level 2!"
  • Ohne diesen Taktgeber würde der Roboter versuchen, beim Einfügen (Level 2) nach links und rechts zu suchen (Level 1), was ihn nur noch mehr hängen lässt. PhaForce weiß genau, welche Werkzeuge er in welchem Moment benutzen darf.

Warum ist das so erfolgreich?

In Tests mit echten Robotern hat PhaForce gezeigt, dass es viel besser ist als alle bisherigen Methoden:

  • Beim Einstecken (z. B. USB oder Ladekabel): Frühere Roboter steckten oft schief ein, blieben hängen oder drehten sich im Griff. PhaForce spürt das Haken sofort, zieht sich einen Millimeter zurück, sucht neu und steckt dann perfekt ein.
  • Beim Wischen: Wenn die Tafel etwas höher steht als erwartet (eine Situation, die der Roboter nie gesehen hat), scheitern andere Roboter komplett – sie drücken zu fest oder verlieren den Kontakt. PhaForce passt sich sofort an, indem es die Kraft nutzt, um den Abstand zu regeln, und wischt sauber weiter.

Zusammenfassung in einem Satz:
PhaForce ist wie ein Roboter, der nicht nur sieht, sondern auch fühlt und weiß, wann er fühlen muss – ein langsamer Planer für den großen Überblick und ein blitzschneller Assistent für die feinen Korrekturen, die alles reibungslos machen.