"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation

Each language version is independently generated for its own context, not a direct translation.

"Niet doen!" – Een slimme robot die luistert naar jouw waarschuwingen

Stel je voor dat je een robot hebt die je huis moet schoonmaken. Je wilt dat hij de vloer poets, maar je hebt ook een paar specifieke regels: "Ga niet te dicht bij de open haard, die is heet!" of "Ga de keuken niet in als er een hond is."

Vroeger was dit voor een robot een droom. Als je dit in gewone taal tegen een robot zei, kon hij het vaak niet begrijpen, of hij deed het verkeerd. Hij zou misschien denken: "Oh, een haard? Dat is mooi, ik ga er even op zitten," en dan verbranden. Of hij zou de keuken binnenstappen terwijl de hond er is, en de hond zou hem bijten.

De onderzoekers van dit paper hebben een slimme oplossing bedacht, genaamd STPR. Laten we uitleggen hoe dit werkt met een paar simpele vergelijkingen.

Het probleem: De robot die te veel fantaseert

Grote taalmodellen (zoals de slimme AI's die we vandaag kennen) zijn geweldig in het schrijven van verhalen of het beantwoorden van vragen. Maar als je ze direct vraagt om een route te plannen, zijn ze als een dromerige architect.
Ze kunnen een prachtig plan schetsen op papier, maar ze vergeten vaak de fysieke realiteit. Ze kunnen "hallucineren": ze bedenken een route die er logisch uitziet, maar die dwars door een muur gaat of direct in de haard leidt. Ze zijn te creatief en niet streng genoeg.

De oplossing: De robot als vertaler, niet als planner

In plaats van de AI te laten beslissen waar de robot moet gaan, laten we de AI alleen doen wat hij het beste kan: vertalen.

STPR werkt als een talenvertaler die direct een bouwtekening maakt:

De Vertaler (De AI): Jij zegt tegen de AI: "Vermijd de haard, die is heet." De AI denkt niet na over de route zelf. In plaats daarvan schrijft hij een klein computerprogrammaatje (een Python-functie). Dit programmaatje is als een slimme meetlat. Het zegt: "Als de robot op punt X staat, en die punt is te dicht bij de haard, dan is dat 'verboden terrein'."
De Bouwmeester (De Traditionele Algorithmes): Nu geven we die meetlat aan een heel oude, zeer strenge en logische robot-planner (zoals A* of RRT*). Deze planner is niet creatief, maar hij is onfeilbaar in logica. Hij neemt de meetlat en gebruikt die om het huis te "scannen".
- Waar de meetlat "verboden" zegt, plaatst de planner onzichtbare, ondoordringbare muren in zijn hoofd.
- Hij zoekt dan de kortste weg van A naar B, maar hij mag nooit door die onzichtbare muren.

Waarom is dit zo slim?

Geen dromen, maar feiten: De AI hoeft niet te fantaseren over de route. Hij hoeft alleen maar de regels in code te zetten. De strenge planner zorgt ervoor dat de regels worden nageleefd.
Het is als een onzichtbaar hek: Stel je voor dat de AI een hek om de haard bouwt. De robot ziet het hek niet met zijn camera's, maar in zijn "hersenen" (de software) is het er wel. Hij kan er gewoon niet overheen.
Zelfs kleine robots kunnen het: Het paper toont aan dat je geen super-dure, enorme AI nodig hebt. Zelfs kleinere, snellere modellen kunnen die "meetlat" (de code) perfect schrijven.

Wat hebben ze getest?

Ze hebben dit in een virtueel huis getest met vier moeilijke situaties:

De beveiligingscamera: De robot mocht niet in het zicht van een camera komen. De AI schreef code die precies berekende waar het zichtveld was.
Het gat in de vloer: Er was een onzichtbaar gat (zoals een kussen dat een put bedekt). De AI maakte een code die zei: "Pas op, hier is een gat!"
Het dier in de keuken: Als er een dier is, mag de keuken dicht. De AI begreep deze voorwaarde en bouwde een hek om de keuken.
De hete haard: De robot mocht niet te dichtbij komen, zelfs als de haard niet aanraakt, maar alleen warmte uitstraalt. De AI schreef een formule voor warmteverspreiding en maakte een veiligheidszone.

Het resultaat

In al deze tests lukte het de oude planners (zonder AI) niet: ze liepen dwars door de muren of in de haard. De "dromerige" AI's (die direct een route probeerden te bedenken) faalden ook vaak door hallucinaties.

Maar STPR (de combinatie van vertaler + strenge planner) slaagde 100% van de tijd. De robot vond altijd een weg, of hij gaf eerlijk toe: "Het is onmogelijk om daar te komen zonder de regels te breken."

Conclusie

Dit paper laat zien dat we AI niet hoeven te dwingen om alles zelf te bedenken. Als we AI gebruiken als een slimme vertaler die regels omzet in duidelijke instructies, en die instructies geven aan een strenge, logische planner, krijgen we robots die veilig, betrouwbaar en precies doen wat we van hen verwachten.

Het is alsof je een dromerige schrijver vraagt om de regels van een spel op te schrijven, en dan een strikte scheidsrechter die de regels exact naleeft. Zo krijg je een spel dat zowel creatief als eerlijk is.

"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation

Het probleem: De robot die te veel fantaseert

De oplossing: De robot als vertaler, niet als planner

Waarom is dit zo slim?

Wat hebben ze getest?

Het resultaat

Conclusie

Probleemstelling

Methodologie: STPR (Safe Trajectory Planning with Restrictions)

Kernbijdragen

Resultaten

Betekenis en Conclusie

"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation

Het probleem: De robot die te veel fantaseert

De oplossing: De robot als vertaler, niet als planner

Waarom is dit zo slim?

Wat hebben ze getest?

Het resultaat

Conclusie

Probleemstelling

Methodologie: STPR (Safe Trajectory Planning with Restrictions)

Kernbijdragen

Resultaten

Betekenis en Conclusie

Meer zoals dit

Interpretable Tau-PET Synthesis from Multimodal T1-Weighted and FLAIR MRI Using Partial Information Decomposition Guided Disentangled Quantized Half-UNet

SUPERGLASSES: Benchmarking Vision Language Models as Intelligent Agents for AI Smart Glasses

MultiModalPFN: Extending Prior-Data Fitted Networks for Multimodal Tabular Learning

OpenGLT: A Comprehensive Benchmark of Graph Neural Networks for Graph-Level Tasks

A Survey on 3D Gaussian Splatting