Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning

Het paper introduceert ContextMatters, een raamwerk dat Large Language Models en klassieke planning combineert om via hiërarchische doelrelaxatie haalbare 3D-scèneplannen te genereren, wat resulteert in een aanzienlijke verbetering van het slagingspercentage en succesvolle implementatie op een echte TIAGo-robot.

Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Abdel Hakim Drid, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een robot hebt die je helpt met huishoudelijke klusjes. Je vraagt hem: "Zet het dinerbord klaar met twee vorken."

In een perfecte wereld zou de robot gewoon naar de keuken gaan, de lade openen, twee vorken pakken en ze op tafel leggen. Maar in de echte wereld gaat dat vaak mis:

  • De lade zit vast.
  • Er zijn geen schone vorken in huis.
  • Er staan wel lepels op het aanrecht.

Hoe reageren huidige robots?

  1. De "Dromer" (Alleen AI): Deze robot denkt: "Geen probleem!" en plant een route om de lade open te maken. Maar als hij er aankomt, botst hij tegen de gesloten lade aan en valt in de war. Hij hallucineerde dat de lade open zou zijn.
  2. De "Stijve Regelvolger" (Klassieke planning): Deze robot kijkt naar de regels en zegt: "Lade is dicht, vorken zijn er niet. Opdracht mislukt." Hij geeft direct op, zelfs als er wel lepels zijn die je kunt gebruiken.

De oplossing: ContextMatters
De auteurs van dit paper hebben een slimme nieuwe methode bedacht, genaamd ContextMatters. Je kunt je dit voorstellen als een slimme kok die kookt met wat er in de koelkast ligt, in plaats van te zeggen "Ik kan niet koken omdat ik geen garnalen heb".

Hier is hoe het werkt, stap voor stap, met een paar creatieve vergelijkingen:

1. De Twee Assen van Slimheid

Het systeem kijkt naar twee dingen tegelijk, alsof het een kaart volgt:

  • Wat moet er gebeuren? (Functie): De bedoeling van de taak.
  • Wat is er mogelijk? (Haalbaarheid): Wat er echt in de kamer staat.

2. Het "Relaxeren" van de Doelen

Als de robot merkt dat zijn oorspronkelijke plan niet werkt, geeft hij niet op. In plaats daarvan "relaxt" hij het doel.

  • Vergelijking: Stel je wilt een taart bakken, maar je hebt geen eieren. Een stijve robot zegt: "Taart maken is onmogelijk." Een ContextMatters-robot zegt: "Oké, geen eieren? Dan maken we een taart zonder eieren, of we maken een pannenkoek, of we halen gewoon een koekje uit de kast."
  • Het systeem vraagt aan de grote taalmodel (LLM): "Kijk eens om je heen. Wat kunnen we gebruiken dat lijkt op een vork, of wat kunnen we doen als we geen vorken hebben?"

3. De Twee Sporen van Aanpassing

Het systeem gebruikt twee slimme manieren om het doel aan te passen:

  • Het Verplaatsen (Shifting): Als de robot niet bij de vorken in de lade kan komen, zegt hij: "Oké, de lade is dicht. Laten we kijken of er vorken op het aanrecht staan." Hij verplaatst zijn zoektocht naar een andere plek in het huis.
  • Het Verslappen (Relaxing): Als er echt geen vorken zijn, zegt hij: "Oké, we kunnen geen vorken gebruiken. Laten we de taak veranderen in: 'Zet het bord klaar met lepels'." De bedoeling (eten zetten) blijft hetzelfde, maar het middel (vorken) wordt vervangen door iets haalbaars (lepels).

4. De Controleur (De "Bureaucraat")

Tussen de dromer (AI) en de robot zit een strenge controleur (een klassieke planner).

  • Vergelijking: De AI is de creatieve chef die ideeën bedenkt ("Laten we een vliegtuig bouwen!"). De controleur is de ingenieur die zegt: "Wacht, we hebben geen vleugels. Dat kan niet."
  • De AI krijgt dan feedback: "Geen vleugels? Oké, dan bouwen we een auto." De AI probeert het opnieuw, maar nu met een haalbaar plan. Dit gaat door tot het plan echt werkt in de echte wereld.

Het Resultaat

In tests bleek dat deze methode 52% succesvoller was dan de beste bestaande methoden.

  • Waar andere robots faalden omdat ze vastzaten aan hun oorspronkelijke plan, slaagde ContextMatters door slim te improviseren.
  • Ze hebben dit zelfs getest op een echte robot (TIAGo) in een echt huis. De robot kreeg de opdracht: "Breng 4 kinder-snacks naar tafel." Er waren maar 3 snacks. In plaats van te falen, zei de robot: "Oké, ik haal 3 snacks en een blikje cola (want dat is ook iets lekkers voor kinderen, maar geen alcohol)." Hij bracht het allemaal naar tafel.

Kortom:
ContextMatters leert robots om niet als een stugge computer te denken ("Plan mislukt"), maar als een menselijk hulpje dat denkt: "Het plan werkt niet, maar ik heb een idee om het toch voor elkaar te krijgen met wat we wel hebben." Het is het verschil tussen "Ik geef op" en "Ik pas me aan".