From Next Token Prediction to (STRIPS) World Models

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een robot wilt leren hoe een spel werkt, zoals het verplaatsen van blokken op een tafel (een klassiek probleem in kunstmatige intelligentie genaamd "Blocksworld"). Je geeft de robot geen handleiding. In plaats daarvan laat je hem alleen maar kijken naar een reeks bewegingen: "Blok A op blok B leggen", "Blok C verplaatsen", enzovoort.

De vraag die deze auteurs stellen is: Kan een moderne AI (een "Transformer", de technologie achter ChatGPT) door alleen maar naar deze bewegingen te kijken, niet alleen voorspellen wat er als volgende gebeurt, maar ook echt begrijpen hoe de wereld werkt? Zodat hij later zelf een plan kan maken om een doel te bereiken, zelfs in situaties die hij nog nooit heeft gezien?

Het antwoord in dit papier is een enthousiast ja, maar met een belangrijke nuance over hoe je de robot leert.

Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen:

1. Het Probleem: De "Gokker" versus de "Architect"

Stel je twee soorten studenten voor die een spel moeten leren:

De Gokker (Standaard AI): Deze student leert door patronen te zien. "Als ik blok A zie, komt er vaak blok B." Hij is goed in het raden van het volgende woord in een zin, maar hij heeft geen echt inzicht in de regels. Als je hem een heel lang verhaal geeft, raakt hij de draad kwijt. Hij onthoudt alleen oppervlakkige patronen.
De Architect (De nieuwe modellen): Deze student probeert de onderliggende regels van het spel te ontdekken. Hij denkt: "Ah, blok A kan alleen op B liggen als B vrij is." Hij bouwt een mentaal model van de wereld.

De onderzoekers wilden weten of de "Gokker" (de standaard AI) door simpelweg het volgende woord te voorspellen, uiteindelijk toch een "Architect" kan worden.

2. De Oplossing: Twee Manieren van Leren

De auteurs hebben twee soorten "robots" (architecturen) getest om dit te leren:

A. De "STRIPS-Transformer" (De Robot met een Bouwplan)

Dit model is speciaal ontworpen met de regels van het spel ingebouwd.

De Analogie: Stel je voor dat je een robot bouwt met een ingebouwd kompas en een kaart. Hij weet al dat hij "nooit door een muur kan lopen". Hij is dus vooraf al geschoold op de logica van het spel.
Het Resultaat: Hij is heel goed in het begrijpen van de regels, maar hij is moeilijk te trainen. Het is alsof je probeert een zeer complexe machine te kalibreren; hij heeft heel veel voorbeelden nodig en het duurt lang voordat hij "klikt". Als hij het eenmaal snapt, werkt hij perfect.

B. De "Stick-Breaking Transformer" (De Slimme Gokker)

Dit is een standaard AI, maar met een slimme trucje: een nieuwe manier om te kijken naar de volgorde van gebeurtenissen (genaamd "stick-breaking attention").

De Analogie: Stel je voor dat je een detective bent die een lange lijst van getuigenverklaringen leest. Een gewone detective vergeet snel wat er eerder is gezegd. Deze detective heeft echter een magische stok. Elke keer als hij een nieuw getuige hoort, breekt hij een stukje van de stok af. De laatste stukjes (de meest recente gebeurtenissen) blijven het grootst en het helderst. Hierdoor onthoudt hij precies wat er net is gebeurd en wat daar direct aan voorafging, zonder de draad kwijt te raken.
Het Resultaat: Dit model is makkelijker te trainen en leert sneller. Het wordt zelfs beter dan de robot met het ingebouwde bouwplan! Het leert de regels van het spel zo goed, dat het uiteindelijk een exacte "handleiding" (een STRIPS-model) kan uitschrijven, zelfs als het alleen maar naar bewegingen keek.

3. De Grootste Prestatie: Generalisatie

Het meest indrukwekkende deel van het onderzoek is wat er gebeurt als je de robots op een nieuw probleem zet.

Stel je voor dat je de robot hebt getraind op een kamer met 5 blokken. Vervolgens vraag je hem om een plan te maken voor een kamer met 8 blokken, of voor een kamer die hij nog nooit heeft gezien.

Standaard AI's (zonder de nieuwe truc): Deze zakken in elkaar. Ze kunnen geen plannen maken voor situaties die te lang zijn of te verschillend van hun training. Ze zijn als een kind dat alleen maar "2+2" heeft geoefend en niet snapt wat "2+3" is.
De nieuwe modellen: Deze kunnen exponentieel meer situaties aan. Ze hebben de regels geleerd, niet alleen de voorbeelden. Ze kunnen een plan maken voor een wereld met miljoenen mogelijke startpunten en doelen, zelfs als ze die specifieke combinatie nooit hebben gezien.

4. Hoe werkt het in de praktijk?

De onderzoekers hebben getoond dat ze deze AI's kunnen gebruiken om een symboolisch model te extraheren.

De Analogie: Het is alsof je een robot laat kijken naar een duizend pagina's lang dagboek van een speler. Aan het einde van de training pakt de robot een pen en schrijft zelf de officiële spelregels op: "Als je blok A wilt verplaatsen, moet B leeg zijn."
Vervolgens geven ze deze geschreven regels aan een klassieke, zeer snelle planner (een soort super-rekenmachine voor plannen). Die planner maakt dan het perfecte plan om het doel te bereiken.

Conclusie: Wat betekent dit voor ons?

Dit papier laat zien dat AI's die leren door "het volgende woord te voorspellen" (zoals ChatGPT), inderdaad een wereldmodel kunnen bouwen. Ze begrijpen niet alleen oppervlakkige patronen, maar kunnen de onderliggende logica van een systeem doorgronden.

De les: Als je een AI wilt leren plannen en redeneren, hoef je niet per se ingewikkelde symbolische regels in te bouwen. Je kunt een standaard AI gebruiken, maar je moet hem wel de juiste "bril" geven (zoals de "stick-breaking" techniek) om de volgorde van gebeurtenissen goed te onthouden.
De toekomst: Dit opent de deur voor AI-systemen die niet alleen tekst kunnen genereren, maar die echt kunnen plannen in complexe werelden, van het regelen van logistiek tot het spelen van complexe spelletjes, en dit doen met een flexibiliteit die we eerder alleen bij mensen zagen.

Kortom: De AI is niet langer alleen een slimme parrot die zinnen nabootst; hij is aan het worden van een echte denker die de regels van het spel heeft begrepen.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het paper "From Next Token Prediction to (STRIPS) World Models" in het Nederlands.

Probleemstelling

De kernvraag van dit onderzoek is of Large Language Models (LLMs), en specifiek transformer-architecturen die zijn getraind op next-token prediction (het voorspellen van het volgende token), daadwerkelijk wereldmodellen leren die geschikt zijn voor planning. Hoewel recente studies suggereren dat transformers latentere staten kunnen leren, is het onduidelijk of deze representaties voldoende zijn om complexe planningsproblemen op te lossen, of dat de modellen slechts oppervlakkige statistische patronen volgen.

Het paper richt zich op een gecontroleerde symbolische setting: propositionele STRIPS-wereldmodellen. Hierbij worden toestanden gedefinieerd door sets van atomen (booleaanse variabelen) en acties die atomen toevoegen of verwijderen, mits hun precondities waar zijn. Het doel is om een STRIPS-model (de regels van de wereld) te leren uitsluitend uit reeksen van acties (traces), zonder directe observatie van de toestandsveranderingen, en vervolgens te evalueren of dit model kan worden gebruikt voor planning over exponentieel veel ongezichten starttoestanden en doelen.

Methodologie

De auteurs introduceren twee specifieke architecturen om STRIPS-modellen te leren uit positieve (toepasbare) en negatieve (niet-toepasbare) actietraces:

STRIPS Transformer:
- Principe: Een architectuur die expliciet is uitgelijnd met de theoretische structuur van STRIPS en de formele taaltheorie (B-RASP).
- Mechanisme: Het model gebruikt hard attention (geïmplementeerd via stick-breaking attention) om voor elk atoom de meest recente actie te vinden die dat atoom beïnvloedt. Dit sluit naadloos aan bij de logische afhankelijkheid in STRIPS: de toepasbaarheid van een actie hangt af van de laatste actie die de precondities beïnvloedde.
- Structuur: Het heeft één laag met meerdere "heads", waarbij elke head correspondeert met een specifiek atoom in het domein. De parameters coderen direct precondities en effecten (toevoegen/verwijderen).
Stick-Breaking (SB) Transformer:
- Principe: Een standaard decoder-style transformer zonder expliciete symbolische inductieve bias in de architectuur.
- Mechanisme: Het vervangt de standaard softmax-attention en positiële encoding door stick-breaking attention. Deze methode is differentieerbaar maar benadert hard attention, waarbij de aandacht zich concentreert op de meest recente hoog-scorende voorganger (recency bias).
- Leren: Het model leert de toepasbaarheid van acties via een superviseerde leeropdracht. Na het trainen wordt een STRIPS-model geëxtraheerd uit de getrainde parameters door de toepasbaarheid van speciale "test-p" acties te analyseren, wat de waarheidswaarden van atomen in de staat onthult.

Training en Extractie:

De modellen worden getraind op traces die bestaan uit domeinacties en speciale "setup"-acties (zoals init-p om de starttoestand te coderen en test-p om de doeltoestand te controleren).
Na training wordt een symbolisch STRIPS-model ( $M'$ ) geëxtraheerd. Voor de STRIPS Transformer gebeurt dit door de parameters te binariseren; voor de SB Transformer gebeurt dit via een "state probing" proces waarbij de modelvoorspellingen worden gebruikt om de effecten van acties af te leiden.
Het geëxtraheerde model wordt vervolgens ingevoerd in een klassieke STRIPS-planner (Mimir) om plannen te genereren.

Belangrijkste Bijdragen

Theoretische Link: Het paper bevestigt de link tussen hard-attention transformers en de klasse van star-free languages (via B-RASP), wat theoretisch onderbouwt dat transformers STRIPS-domeinen kunnen herkennen.
Twee Architecturen: Het introduceert en vergelijkt een sterk gestructureerde symbolische architectuur (STRIPS Transformer) met een flexibele, standaard transformer-variant (SB Transformer) die toch tot een symbolisch model kan worden gereduceerd.
Combinatorische Generalisatie: Het bewijst dat beide modellen kunnen generaliseren naar een exponentieel aantal ongezichten starttoestanden en doelen, wat een cruciale eigenschap is voor echt wereldmodelleren.
Rol van Stick-Breaking Attention: Het toont aan dat standaard transformers (met softmax) falen in het generaliseren naar lange traces, terwijl het gebruik van stick-breaking attention dit probleem oplost en bijna perfecte generalisatie mogelijk maakt.

Resultaten

De experimenten zijn uitgevoerd op vijf klassieke planningsdomeinen (Blocksworld, Ferry, N-puzzle, Maze, Logistics) met variërende grootte.

Generalisatie naar Lange Traces: Standaard transformers (met sinusoidale positiële encoding of RoPE) behalen hoge trainingsnauwkeurigheid, maar falen volledig bij het generaliseren naar langere testtraces (nauwkeurigheid daalt naar ~20-30%). De SB Transformer behaalt daarentegen bijna perfecte nauwkeurigheid (>99%) op lange traces.
Planningsprestaties:
- De SB Transformer overtreft consistent de STRIPS Transformer. Hoewel de STRIPS Transformer meer symbolische structuur heeft, is deze moeilijker te optimaliseren en vereist hij grotere datasets om betrouwbaar te generaliseren.
- De SB Transformer leert sneller, generaliseert beter en produceert STRIPS-modellen die met klassieke planners (zoals Mimir met de FF-heuristiek) perfect plannen genereren voor ongezichten problemen.
Symbolische Extractie: Zelfs als standaard transformers (zonder stick-breaking) falen in directe voorspelling op lange traces, blijkt dat het symbolische model dat uit hun training op korte traces wordt geëxtraheerd, wel degelijk correct is en perfect kan plannen. Dit suggereert dat ze de dynamiek wel leren, maar moeite hebben met het extrapoleren ervan.
Combinatorische Generalisatie: Beide modellen kunnen plannen voor starttoestanden en doelen die nooit in de trainingsdata zijn gezien, wat aantoont dat ze een echt wereldmodel hebben geleerd en niet alleen de data uit het hoofd hebben geleerd.

Betekenis en Conclusie

Dit paper levert een sterk bewijs dat next-token prediction in een gecontroleerde setting kan leiden tot het leren van wereldmodellen die geschikt zijn voor planning. De belangrijkste inzichten zijn:

Architectuur is cruciaal: Standaard transformers zijn niet voldoende voor lange-termijn redenering in dit domein; specifieke mechanismen zoals stick-breaking attention zijn noodzakelijk om de benodigde "recency bias" en hard attention te simuleren.
Symbolische uitwisselbaarheid: Het is mogelijk om een puur neurale architectuur (SB Transformer) te trainen en er een exact, interpreteerbaar symbolisch STRIPS-model uit te halen dat werkt met bestaande planners.
Inductieve Bias vs. Optimalisatie: Hoewel een sterk symbolisch inductieve bias (STRIPS Transformer) theoretisch aantrekkelijk is, blijkt in de praktijk dat een flexibeler model (SB Transformer) met de juiste attention-mechanismen makkelijker te trainen is en betere generalisatie-eigenschappen vertoont.

De studie suggereert dat de weg naar robuuste wereldmodellen in AI niet noodzakelijk leidt via pure statistische patronen, maar via het combineren van transformer-architecturen met mechanismen die de structuur van logische redenering (zoals in STRIPS) nabootsen.

From Next Token Prediction to (STRIPS) World Models

1. Het Probleem: De "Gokker" versus de "Architect"

2. De Oplossing: Twee Manieren van Leren

A. De "STRIPS-Transformer" (De Robot met een Bouwplan)

B. De "Stick-Breaking Transformer" (De Slimme Gokker)

3. De Grootste Prestatie: Generalisatie

4. Hoe werkt het in de praktijk?

Conclusie: Wat betekent dit voor ons?

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

Meer zoals dit

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

PACED: Distillation at the Frontier of Student Competence

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

Reversible Lifelong Model Editing via Semantic Routing-Based LoRA