From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers

Dit artikel toont aan dat door het introduceren van drie minimale inductieve biases — ruimtelijke gladheid, stabiliteit en temporele lokaliteit — generieke Transformers kunnen evolueren van loutere curve-fitters naar agenten die in staat zijn fundamentele natuurwetten zoals Newtoniaanse krachten te ontdekken, waardoor de kloof tussen hoge voorspellende nauwkeurigheid en werkelijk causaal begrip wordt overbrugd.

Oorspronkelijke auteurs: Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

Gepubliceerd 2026-02-09
📖 6 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Ziming Liu, Sophia Sanborn, Surya Ganguli, Andreas Tolias

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je voor dat je een superintelligente robotstudent hebt. Je wilt hem leren hoe planeten rond de zon bewegen. Je geeft hem een enorm geschiedenisboek over waar de planeten zijn geweest, en je vraagt hem te raden waar ze de volgende keer zullen zijn.

De grote vraag die dit artikel stelt is: Kan deze robotstudent simpelweg het pad uit het hoofd leren, of kan hij de natuurkundige wetten die de beweging veroorzaken daadwerkelijk begrijpen?

De auteurs ontdekten dat de robot zonder speciale "steunwieltjes" (die zij inductieve biases noemen) een briljante onthouder is, maar een verschrikkelijke natuurkundige. Hij leert het pad perfect te tekenen, maar heeft geen idee waarom de planeet die weg aflegt.

Hier is het verhaal van hoe ze de robot hebben gerepareerd, opgedeeld in drie eenvoudige lessen.

Het Probleem: De Robot is een "Curve-Fitter", Geen "Natuurkundige"

Denk aan het brein van de robot als een enorme bibliotheek.

  • De Kepler-benadering (Wat de robot van nature deed): De robot kijkt naar de laatste 1.000 punten van een reis van een planeet. Hij zegt: "Aha! Ik zie het patroon. Het is een ovale vorm. Ik zal gewoon de ovaal blijven tekenen." Het is als een kind dat een tekening overtrekt. Het krijgt de tekening goed, maar als je vraagt: "Waarom is het een ovaal?" of "Welke kracht trekt eraan?", heeft de robot geen antwoord. Hij kent alleen de vorm.
  • De Newton-benadering (Wat we willen): We willen dat de robot zegt: "De zon trekt aan de planeet met zwaartekracht. Als ik de huidige snelheid en positie van de planeet weet, kan ik de aantrekkingskracht berekenen en de volgende stap voorspellen." Dit is het begrijpen van de oorzaak, niet alleen het gevolg.

Het artikel laat zien dat standaard AI-modellen (Transformers) van nature "overtrekkers" worden (Kepler) en falen om "rekenaars" (Newton) te worden. Om dit te repareren, voegden de auteurs drie specifieke "steunwieltjes" toe.


Les 1: Het "Gepixelde Kaart"-probleem (Ruimtelijke Gladheid)

De Analogie: Stel je voor dat je een robot probeert te leren navigeren door een stad.

  • De Fout: Je geeft de robot een kaart waarbij elke straathoek een compleet andere, willekeurige kleur heeft. "Rood" is de hoek van 1e en Main. "Blauw" is de hoek van 1e en 2e. Hoewel deze hoeken direct naast elkaar liggen, ziet de robot ze als totaal ongerelateerd. Hij moet de relatie tussen "Rood" en "Blauw" telkens opnieuw leren.
  • De Fout: De auteurs realiseerden zich dat wanneer ze de positie van de planeet in kleine "bakjes" (bins) hakten (zoals pixels), ze de natuurlijke gladheid van de ruimte doorbraken.
  • De Oplossing: Ze maakten de "bakjes" groter (minder kleuren) of stopten volledig met het gebruik van bakjes en gaven de robot simpelweg de exacte coördinaten (zoals een GPS). Dit stelde de robot in staat om te zien dat "Punt A" direct naast "Punt B" ligt, wat hielp bij het opbouwen van een echte mentale kaart van de ruimte in plaats van een verwarrende bende van willekeurige codes.

Les 2: Het "Dominosteen-effect"-probleem (Ruimtelijke Stabiliteit)

De Analogie: Stel je voor dat je een spelletje "Telefoontje" speelt waarbij je een getal fluistert naar de volgende persoon.

  • De Fout: Als de eerste persoon "50,1" fluistert en de tweede persoon hoort "50,2", dan hoort de derde persoon misschien "50,5", en tegen de tijd dat het bij de laatste persoon is, is het getal "100". In de natuurkunde geldt: als de robot een piepkleine fout maakt in het voorspellen van de positie van de planeet, wordt die fout bij elke stap groter, totdat de planeet de diepe ruimte in vliegt of tegen de zon botst.
  • De Fout: De auteurs realiseerden zich dat standaard AI-training te "perfect" is. Het leert alleen van perfecte historische data.
  • De Oplossing: Ze begonnen de trainingsdata van de robot expres te "breken". Ze voegden een beetje statische ruis toe (zoals statische elektriciteit op een radio) aan de geschiedenis die de robot las. Dit dwong de robot om te leren hoe hij moet herstellen van kleine fouten, waardoor hij robuust genoeg werd om de toekomst te voorspellen zonder dat de fouten zich opstapelden.

Les 3: Het "Lang Geheugen" vs. "Kort Geheugen"-probleem (Temporele Localiteit)

De Analogie: Dit is het belangrijkste deel.

  • Het Lange Geheugen (Kepler): Stel je een robot voor die zich alles herinnert dat de afgelopen uur is gebeurd. Wanneer hij probeert te raden wat er nu gaat gebeuren, kijkt hij naar het hele uur aan geschiedenis om een grote curve te tekenen. Het is also als kijken naar een heel achtbaan-spoor om te raden waar de kar nu heen gaat. Het werkt voor de curve, maar het begrijpt de natuurkunde niet.
  • Het Korte Geheugen (Newton): Stel je nu een robot voor die alleen de laatste twee seconden mag onthouden. Hij kan het hele spoor niet zien. Hij moet kijken naar waar de kar op dit moment is en hoe snel hij op dit moment gaat om te bepalen waar hij naartoe gaat.
  • De Oplossing: De auteurs dwongen de robot om een kort geheugen te hebben. Ze zeiden tegen hem: "Je mag alleen naar het onmiddellijke verleden kijken."
  • Het Resultaat: Omdat de robot niet langer kon vertrouwen op de "grote lijn" van de curve, werd hij gedwongen om de regels van het spel te ontdekken. Hij moest de onzichtbare "trekkracht" (zwaartekracht) berekenen die op de planeet werkt op dit moment om de volgende stap te voorspellen. Plotseling stopte de robot met het tekenen van ellipsen en begon hij krachten te berekenen. Hij werd een natuurkundige.

De Belangrijkste Conclusie

Het artikel concludeert dat hoe je het brein van de AI ontwerpt, bepaalt wat het leert.

  • Als je het toestaat om alles te bekijken en een gepixelde kaart te gebruiken, wordt het een curve-fitter (Kepler). Het tekent mooie plaatjes maar begrijpt het universum niet.
  • Als je het een gladde kaart geeft, het leert om met fouten om te gaan en het dwingt om een kort geheugen te hebben, wordt het een natuurkundige (Newton). Het ontdekt de wetten van de zwaartekracht uit zichzelf.

De auteurs laten zien dat je de natuurkundige wetten niet in de AI hoeft te programmeren. Je hoeft het alleen maar de juiste "inductieve biases" (de juiste trainingsbeperkingen) te geven, en de AI zal de wetten zelf ontdekken.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →