Compositional Neuro-Symbolic Reasoning

Dit paper introduceert een composioneel neuro-symbolisch redeneersysteem dat objectgerichte perceptie, neurale voorstellen voor transformaties en symbolische consistentiefiltering combineert om de generalisatie van grote taalmodellen op de ARC-AGI-2-taak aanzienlijk te verbeteren zonder taakspecifieke finetuning.

Anugyan Das, Omkar Ghugarkar, Vishvesh Bhat, Asad Aali

Gepubliceerd 2026-04-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een puzzel oplost, zoals een Sudoku of een Legpuzzel, maar dan met gekleurde blokjes op een rooster. Dit is wat het ARC (Abstraction and Reasoning Corpus) doet. Het is een test om te zien of een computer echt slim is, of dat hij alleen maar dingen uit zijn hoofd heeft geleerd.

Deze paper beschrijft een nieuwe manier om computers slim te maken voor deze puzzels. De auteurs noemen hun systeem een "Neuro-Symbolic Reasoner". Dat klinkt ingewikkeld, maar het is eigenlijk heel simpel als je het vergelijkt met hoe een mens denkt.

Hier is de uitleg in gewone taal, met een paar creatieve vergelijkingen:

1. Het Probleem: Twee Slechte Opties

Vroeger hadden computers twee manieren om te proberen deze puzzels op te lossen, en beide hadden grote nadelen:

  • Optie A: De "Grote Leraar" (Neurale Netwerken/LLM's)
    Stel je een zeer slimme student voor die miljoenen boeken heeft gelezen. Hij kan heel goed praten en patronen herkennen. Maar als je hem een nieuwe, rare puzzel geeft, raakt hij in de war. Hij probeert te raden op basis van wat hij eerder heeft gezien, maar hij begrijpt de regels erachter niet echt. Hij is als een acteur die een rol speelt: hij ziet er slim uit, maar als de situatie verandert, faalt hij.
  • Optie B: De "Strenge Rekenaar" (Symbolische Systemen)
    Stel je nu een robot voor die alleen maar exacte regels volgt. Hij is perfect in wiskunde, maar hij ziet de kleuren en vormen op het rooster niet. Hij kan niet zeggen: "Oh, dat is een rode cirkel." Hij ziet alleen maar getallen. Hij is als een chef-kok die alleen recepten kan lezen, maar niet kan zien of de groenten vers zijn.

2. De Oplossing: Een Perfect Team

De auteurs van deze paper zeggen: "Laten we deze twee samenwerken!" Ze bouwen een systeem dat werkt als een detective-team.

Het proces verloopt in vier stappen, die we kunnen vergelijken met het oplossen van een mysterie:

Stap 1: De Foto maken (Perceptie)

Eerst kijkt het systeem naar de puzzel (het rooster met blokjes). In plaats van alleen naar de pixels te kijken, maakt het een schets.

  • Vergelijking: Het is alsof je een tekening maakt van de puzzel en zegt: "Hier is een rode vierkante doos, hier is een blauwe lijn, en hier is een gat in het midden."
  • Het systeem haalt de "objecten" uit de chaos. Het weet nu niet alleen dat er een rood blokje is, maar dat het een rood vierkant is met een gat.

Stap 2: De Hypothesen (De Creatieve Ideeën)

Nu komt de "Grote Leraar" (het neurale deel) in beeld, maar met een belangrijke beperking.

  • Vergelijking: Stel je voor dat je een detective bent die een lijst met mogelijke daders heeft. Je mag niet willekeurig iemand uit de stad kiezen. Je mag alleen kiezen uit een lijst van 22 bekende "daderprofielen" (zoals: "Iemand die alles rood maakt", "Iemand die dingen laat vallen", of "Iemand die spiegelt").
  • Het systeem gebruikt de AI om te raden welke van deze 22 regels waarschijnlijk de oplossing is. Het is creatief, maar binnen een kooi van logische regels.

Stap 3: De Controle (Consistentie)

Dit is het slimste deel. Het systeem kijkt naar alle voorbeelden in de puzzel.

  • Vergelijking: Stel je voor dat je drie getuigen hebt. Als Getuige 1 zegt: "De dader droeg een rode hoed", en Getuige 2 zegt: "De dader droeg een blauwe hoed", dan is er iets mis.
  • Het systeem zoekt naar een regel die voor alle voorbeelden tegelijk werkt. Als een idee alleen maar voor één voorbeeld werkt, wordt het weggegooid. Alleen de regels die voor iedereen kloppen, blijven over. Dit voorkomt dat de computer "raadt" en zorgt dat het echt de logica snapt.

Stap 4: De Oplossing (Het Antwoord)

Als er een regel overblijft die voor alle voorbeelden werkt, past het die regel toe op de laatste, onbekende puzzel.

  • Vergelijking: De detective zegt: "Oké, we weten dat de dader altijd rode hoeden gebruikt. Dus op de laatste foto, waar we de dader nog niet zien, plaatsen we een rode hoed."

Waarom werkt dit beter?

De paper laat zien dat dit systeem veel beter presteert dan alleen maar een grote AI (zoals GPT of Grok) die probeert te raden.

  • Minder gissen: Door de regels te beperken tot die 22 logische patronen, hoeft de computer niet miljarden mogelijkheden te proberen.
  • Betrouwbaarder: Omdat het systeem controleert of de regel voor alle voorbeelden werkt, maakt het minder fouten bij nieuwe situaties.
  • Resultaat: Op de test (ARC-AGI-2) verbeterde hun systeem de score van een standaard AI van 16% naar 24,4%. Als ze hun systeem combineerden met een andere slimme AI, haalden ze zelfs 30,8%. Dat klinkt misschien niet als veel, maar voor dit soort moeilijke logica-puzzels is dat een enorme sprong.

De Kernboodschap

De belangrijkste les uit deze paper is: Grote modellen alleen zijn niet genoeg.

Om echt slim te zijn (zoals een mens), moet een computer niet alleen "gevoel" hebben (zoals een AI die veel tekst heeft gelezen), maar ook een strakke structuur hebben (zoals een rekenmachine). Je moet de waarneming (wat zie ik?) scheiden van de redenering (wat zijn de regels?).

Het is alsof je een auto bouwt: je hebt een sterke motor nodig (de AI), maar je hebt ook een stuur en een rem (de symbolische regels) nodig om er zeker van te zijn dat je niet tegen een boom rijdt. Door deze twee te combineren, krijgen we computers die niet alleen goed kunnen praten, maar ook echt kunnen denken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →