Recursive Inference Machines for Neural Reasoning

Deze paper introduceert Recursive Inference Machines (RIMs), een neuraal redeneerkader dat klassieke inferentiemechanismen integreert om bestaande modellen zoals TRMs te verbeteren en prestaties op complexe taken zoals ARC-AGI en Sudoku te verhogen.

Mieszko Komisarczyk, Saurabh Mathur, Maurice Kraus, Sriraam Natarajan, Kristian Kersting

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De "Rekenmachine met een Gedachtenkrant": Een Simpele Uitleg van RIMs

Stel je voor dat je een heel moeilijk raadsel moet oplossen, zoals een Sudoku of een ingewikkeld legpuzzel. In het verleden probeerden computers dit op twee manieren:

  1. De snelle, instinctieve manier: De computer kijkt naar het probleem en schiet direct een antwoord eruit, gebaseerd op wat hij eerder heeft gezien. Dit werkt goed voor simpele dingen, maar bij moeilijke raadsels maakt hij snel fouten.
  2. De "dromerige" manier: De computer probeert te redeneren door langzaam na te denken, maar hij heeft geen goed systeem om zijn gedachten te ordenen. Hij raakt in de war of herhaalt fouten.

De auteurs van dit paper hebben een nieuwe manier bedacht om computers slimmer te maken. Ze noemen dit RIMs (Recursive Inference Machines). Laten we dit uitleggen met een paar leuke metaforen.

1. Het Probleem: De "Vaste" Computer

Stel je een computer voor als een kok die een recept probeert te volgen.

  • De oude modellen (zoals de Tiny Recursive Models of TRM) zijn als een kok die elke stap van het recept in één keer probeert te doen. Hij kijkt naar de ingrediënten, roert even, en hoopt dat het lukt.
  • Het probleem is dat hij geen tijd neemt om te controleren of hij de suiker niet per ongeluk met zout heeft verwisseld. Als hij een fout maakt in stap 3, blijft die fout zitten en wordt het hele gerecht (het antwoord) onbruikbaar.

2. De Oplossing: De RIM (De Kok met een Gedachtenkrant)

De RIM is als een kok die een gedachtenkrant (een "scratchpad") bijhoudt. Hij doet het niet in één keer, maar in een cyclus van drie stappen, net als een detective die een zaak oplost:

  1. De Ontdekker (Solver): Deze kijkt naar het probleem en zegt: "Ik denk dat we dit stukje van de puzzel hier moeten leggen." Hij maakt een voorstel.
  2. De Controleur (Reweighter): Dit is de sterkste nieuwe uitvinding in dit paper. De Controleur kijkt naar het voorstel van de Ontdekker en zegt: "Wacht even. Dit lijkt goed, maar kijk naar wat we gisteren dachten. Misschien is dit voorstel te ver weg van de waarheid?"
    • In de oude modellen negeerde de computer zijn eigen eerdere gedachten of nam hij ze 1-op-1 over.
    • De Controleur weegt de nieuwe gedachte af tegen de oude. Hij zegt: "We houden 80% van je oude idee en voegen 20% van je nieuwe idee toe." Of hij zegt: "Nee, dit nieuwe idee is te gek, we gooien het weg."
    • Dit zorgt ervoor dat de computer niet "doordraaft" in een fout, maar rustig en gestructureerd naar het juiste antwoord toe beweegt.
  3. De Oplosser (Generator): Als de Controleur akkoord gaat, schrijft de Oplosser het nieuwe, verbeterde antwoord op in het notitieboekje.

Dit proces (Ontdekken -> Controleren -> Oplossen) herhaalt de computer zich keer op keer. Elke keer wordt het antwoord iets beter, net als wanneer je een beeld scherpstelt tot het helemaal helder is.

3. Waarom is dit zo slim? (De Analogie van de "Rekenmachine")

De auteurs vergelijken hun systeem met een stochastische rekenmachine (een wiskundige methode die al jaren bestaat voor het oplossen van complexe problemen).

  • Vroeger: Computers deden alsof ze een wiskundig probleem oplosten, maar ze vergeten de "correctiefactor" (de weging). Het is alsof je een bal gooit en hoopt dat hij in het doel belandt, zonder te kijken of je te hard hebt gegooid.
  • Nu (met RIM): De computer gebruikt de Controleur als een "rem en versneller". Hij past zijn gedachten continu aan.
    • Als de computer een nieuwe gedachte heeft die te gek klinkt, dempt hij deze (zoals een geluidsdemper).
    • Als de gedachte logisch is, versterkt hij deze.

4. Wat hebben ze bewezen?

De auteurs hebben hun nieuwe "Rekenmachine met Gedachtenkrant" getest op drie soorten moeilijke taken:

  1. ARC-AGI (Visuele puzzels): Denk aan het vinden van patronen in plaatjes. De RIM kon beter redeneren dan de oude modellen, vooral bij de allerzwaarste puzzels.
  2. Sudoku Extreme: Hier moest de computer een heel moeilijk Sudoku oplossen. De RIM haalde een hoger score omdat hij zijn fouten kon "terugdraaien" en corrigeren, in plaats van vast te lopen.
  3. Medische diagnoses (Tabulaire data): Stel je voor dat je medische gegevens hebt, maar 25% van de cijfers is per ongeluk verkeerd ingevoerd (ruis).
    • Een oude model zou hierdoor een verkeerde diagnose stellen.
    • De TabRIM (een variant voor tabellen) gebruikt een methode die lijkt op het "dichtbijen" van een wazig beeld. Hij probeert steeds opnieuw te raden wat de juiste cijfers zouden moeten zijn, controleert ze, en gebruikt alleen de meest waarschijnlijke cijfers om de diagnose te stellen. Hierdoor was hij veel accurater, zelfs met slechte data.

Samenvatting in één zin

Deze paper introduceert een slimme manier om computers te laten "nadenken" door ze niet alleen te laten voorstellen wat ze denken, maar hen ook een slimme controleur te geven die die gedachten continu afweegt en corrigeert, waardoor ze veel beter zijn in het oplossen van moeilijke raadsels en het omgaan met fouten in de data.

Het is alsof je een student niet alleen laat leren, maar hem ook een studiegenoot geeft die elke stap controleert en zegt: "Zeker weten? Misschien moeten we dat nog eens overdenken." Dat maakt het eindresultaat veel betrouwbaarder.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →