Self-Supervised Inductive Logic Programming

Dit paper introduceert Poker, een nieuw zelftoezichtend ILP-systeem dat zonder vooraf gedefinieerde achtergrondtheorie of negatieve voorbeelden recursieve logica-programma's kan leren door automatisch nieuwe voorbeelden te genereren en te labelen, wat leidt tot betere generalisatie dan bestaande systemen zoals Louise.

Stassa Patsantzis

Gepubliceerd 2026-03-05
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Kern: Een Taalleraar zonder Antwoordenboek

Stel je voor dat je een kind wilt leren een nieuwe taal spreken. In de traditionele manier van leren (wat onderzoekers "Inductive Logic Programming" of ILP noemen), moet je als leraar twee dingen doen:

  1. Een woordenboek en grammatica-regels geven: Je vertelt het kind welke woorden er bestaan en hoe ze aan elkaar geplakt kunnen worden.
  2. Oefeningen met antwoorden geven: Je geeft het kind zinnen die wel kloppen (positieve voorbeelden) en zinnen die niet kloppen (negatieve voorbeelden), zodat het kind leert wat fout is.

Het probleem is dat dit veel werk voor de leraar is. Je moet voor elk nieuw onderwerp een heel specifiek woordenboek maken en zelf bedenken welke zinnen fout zijn. Als je dit vergeet, leert het kind misschien dat "alle woorden in de wereld" een geldige zin zijn, en dat is niet wat je wilt.

De Oplossing: Poker (De Slimme Leraar)

De auteur, Stassa Patsantzis, introduceert een nieuw systeem genaamd Poker. Poker is een "zelflerende" AI die het werk van de leraar overneemt.

Hoe werkt Poker?
Stel je voor dat Poker een detective is die een geheim codeboek probeert te kraken.

  1. De Start: Poker krijgt een paar voorbeelden van zinnen die wel kloppen (bijvoorbeeld: "1100" is goed). Maar het krijgt geen lijst met foutieve zinnen en het heeft geen specifiek woordenboek. Het heeft alleen een heel algemeen idee van wat een woord is (bijvoorbeeld: "1" en "0" bestaan).
  2. Het Gokspel (De Naam): De naam "Poker" is een knipoog naar de filosoof Wittgenstein en zijn "pokerface", maar ook naar het spel. Poker moet gissen. Het maakt een hypothese (een gok) over hoe de taal werkt.
  3. Het Zelf-creëren van Voorbeelden: Omdat Poker geen lijst met fouten heeft, verzonnt het die zelf.
    • Het denkt: "Oké, als mijn theorie klopt, dan zou '111000' ook moeten werken."
    • Het probeert die zin te maken. Als het lukt, maar de zin eigenlijk niet in de echte taal hoort, dan heeft Poker een probleem.
    • Poker kijkt dan: "Wacht, mijn theorie zegt dat dit goed is, maar mijn andere theorieën zeggen dat dit fout is." Hierdoor ontdekt het een tegenstrijdigheid.
  4. Het Leren van Fouten: Door deze tegenstrijdigheden te vinden, kan Poker zichzelf zeggen: "Ah, deze zin is eigenlijk fout!" en het voegt die toe aan zijn lijst van fouten. Zo leert het langzaam wat niet mag, zonder dat een mens het ooit heeft verteld.

De Magische Regel: De "Alles-dekkende" Grammatica

Een ander groot probleem bij AI is dat je vaak een heel specifiek boekje nodig hebt voor elke taak. Poker gebruikt echter een SONF (Second Order Definite Normal Form).

  • De Metafoor: Stel je voor dat je een sleutel hebt die niet voor één deur is gemaakt, maar voor elke deur in het hele huis.
  • In plaats van dat jij voor elke nieuwe taal een nieuw woordenboek moet schrijven, geeft Poker een universeel, heel algemeen raamwerk. Dit raamwerk is zo breed dat het elke mogelijke grammatica kan bevatten.
  • Omdat dit raamwerk zo breed is, zou je denken dat de AI alles goed zou vinden. Maar dankzij het zelf-creëren van fouten (zoals hierboven beschreven), weet Poker precies welke deuren niet open gaan, en leert het de specifieke taal.

Wat hebben ze bewezen?

De auteurs hebben Poker getest op twee dingen:

  1. Fractals (L-systemen): Denk aan de takken van een boom of een sneeuwvlok. Poker leerde hoe je deze patronen moet tekenen door alleen positieve voorbeelden te zien en zelf fouten te bedenken.
  2. Talen (Context-Free Grammars): Denk aan het patroon van evenveel enen als nullen (zoals 1100 of 111000).

Het resultaat:

  • Poker werd steeds slimmer naarmate het meer voorbeelden (zowel de gegeven als de zelfbedachte) kreeg. Het leerde de juiste regels.
  • Louise (een bestaand, geavanceerd systeem) faalde. Omdat Louise geen negatieve voorbeelden kreeg en die ook niet zelf kon bedenken, werd het te vrijblijvend. Het dacht dat alles goed was (over-generalisatie) en leerde geen specifieke regels.

Samenvatting in één zin

Poker is een slimme AI die, net als een detective, niet wacht op een lijst met fouten, maar zelf "misdaadplekken" bedenkt om zo de regels van een taal of patroon te leren, zonder dat een mens daarvoor een specifiek handboek hoeft te schrijven.

Dit maakt het veel makkelijker om AI toe te passen op nieuwe, complexe problemen waar we nog geen antwoordenboekje voor hebben.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →