Push Anything: Single- and Multi-Object Pushing From First Sight with Contact-Implicit MPC

Dit artikel introduceert C3+, een verbeterd contact-impliciet MPC-algoritme dat real-time, robuust duwen van één of meerdere objecten met onbekende eigenschappen mogelijk maakt, met een succespercentage van 98% op hardware.

Hien Bui, Yufeiyang Gao, Haoran Yang, Eric Cui, Siddhant Mody, Brian Acosta, Thomas Stephen Felix, Bibit Bianchini, Michael Posa

Gepubliceerd 2026-03-09
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

"Duw Alles": Hoe een robot leert om rommel op te ruimen zonder te tillen

Stel je voor dat je een kamer binnenkomt die vol ligt met speelgoed, boeken en blikjes. Je wilt alles netjes op zijn plek hebben, maar je mag niets oppakken of vasthouden. Je mag alleen duwen, schuiven en duwen. Voor een mens is dit lastig, maar voor een robot is dit een nachtmerrie. Waarom? Omdat robots meestal "denken" in strakke regels: "Als ik dit pak, dan kan ik het verplaatsen." Maar als je alleen mag duwen, wordt het een ingewikkeld puzzelspel van wrijving, botsingen en toeval.

Dit paper introduceert "Push Anything" (Duw Alles), een slim systeem dat robots leert om precies dit soort rommel op te ruimen, zelfs als er veel verschillende voorwerpen tegelijk in de weg liggen.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: De "Lokale Val"

Stel je een robot voor die een knuffel moet duwen naar een hoek. De robot kijkt alleen recht vooruit. Als hij de knuffel nu een beetje duwt, botst die misschien tegen een ander voorwerp aan en stopt. De robot denkt: "Oh nee, dit werkt niet," en stopt. Hij ziet niet dat hij eerst andersom had moeten duwen om ruimte te maken.

Oude robots zaten vaak vast in deze "lokale val". Ze zagen alleen de directe weg, niet het grotere plaatje. Ze wisten niet hoe ze moesten plannen als er tien verschillende dingen in de weg lagen.

2. De Oplossing: Een Slimme Strategische Speler

De onderzoekers hebben een nieuwe manier bedacht om dit op te lossen. Ze gebruiken een techniek die CI-MPC heet (een soort super-snel rekenen dat rekening houdt met botsingen). Maar om dit echt goed te laten werken, hebben ze twee grote verbeteringen toegevoegd:

A. De "Vooruitkijkende Speler" (Sampling)

In plaats van dat de robot alleen kijkt wat hij nu kan doen, laat het systeem de robot eerst "dromen" over verschillende plekken waar hij zijn hand (de grijper) kan zetten.

  • De Analogie: Stel je voor dat je een biljartbal wilt stoten. Je kijkt niet alleen naar de bal, maar je probeert in je hoofd tien verschillende hoeken uit. "Als ik hier stoot, botst hij tegen de rand en komt hij daar." "Als ik daar stoot, duw ik de andere bal weg."
  • Het systeem kiest de beste plek om te beginnen, rent daarheen (zonder iets aan te raken), en begint dan pas met het duwen. Dit helpt de robot uit zijn "lokale val" te komen.

B. De "Super-Snelle Rekenmachine" (C3+)

Dit is het echte geheim. Het oude systeem (C3) was als een student die een moeilijke wiskundepuzzel oplost: het duurt lang, en als er veel voorwerpen zijn, duurt het te lang om nog snel te reageren.

  • De Analogie: Het oude systeem was als iemand die elke stap van een puzzel handmatig uitrekent. Het nieuwe systeem, C3+, is als iemand die de oplossing van de puzzel al kent en alleen nog maar de laatste paar details hoeft in te vullen.
  • Door slimme wiskundige trucjes (die ze "slack variables" noemen, wat je kunt zien als een "uitweg" in de vergelijking), kunnen ze de berekening van botsingen versnellen met een factor van 10.000! Hierdoor kan de robot in echt tijd denken, zelfs als er vier of vijf voorwerpen tegen elkaar duwen.

3. De Praktijk: Van Scannen tot Duwen

Het systeem doet meer dan alleen duwen. Het is een volledig team:

  1. De Ogen: De robot scant de voorwerpen met een camera en maakt er direct een 3D-kaart van (als een digitale schets).
  2. Het Geheugen: Het houdt de voorwerpen in de gaten, zelfs als ze elkaar verstoppen (occlusie).
  3. De Hand: De robot (een Franka Panda-arm) duwt de voorwerpen precies op de plek waar ze moeten zijn.

4. De Resultaten: Een Rommelige Kamer, Opgeruimd

De onderzoekers hebben dit getest in de echte wereld:

  • Ze hebben 33 verschillende voorwerpen gebruikt: van letters en speelgoed tot blikken soep en houten blokken.
  • Ze hebben 928 pogingen gedaan.
  • 98% van de tijd lukte het om de voorwerpen precies op de juiste plek te krijgen.
  • Voor één voorwerp duurde het ongeveer 30 seconden. Voor vier voorwerpen die door elkaar lagen, duurde het ongeveer 5 minuten.

Waarom is dit belangrijk?

Vroeger konden robots alleen dingen verplaatsen als ze precies wisten hoe zwaar en hoe groot ze waren, en als er maar één ding in de weg zat. Dit systeem is algemeen (het werkt op "alles") en snel.

Het is alsof je een robot hebt die niet alleen een simpele opdracht uitvoert, maar echt nadenkt over hoe hij een rommelige kamer kan opruimen door slim te duwen, te schuiven en ruimte te maken, zonder ooit iets vast te pakken. Het is een enorme stap richting robots die echt kunnen helpen in onze huishoudens, fabrieken of magazijnen, waar de chaos vaak groot is.

Kortom: Ze hebben een robot gemaakt die niet alleen duwt, maar strategisch duwt, en dat doet hij zo snel dat hij het in het echt kan doen, zelfs als de tafel vol staat met van alles en nog wat.