Active Causal Structure Learning with Latent Variables: Towards Learning to Detour in Autonomous Robots

Dit artikel beschrijft hoe actief causaal structuurlernen met latente variabelen (ACSLWL) autonome robots in staat stelt om door het actief construeren van nieuwe interne causale modellen onverwachte obstakels, zoals transparante barrières, te omzeilen en zo een suboptimale situatie om te zetten in een voorspelbare situatie met een optimale plan.

Pablo de los Riscos, Fernando J. Corbacho

Gepubliceerd 2026-03-16
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Robot die een "Onzichtbare Muur" Ontdekt

Stel je voor dat je een robot hebt die is getraind om een doel te bereiken, bijvoorbeeld een bal te pakken in een kamer. De robot heeft een intern landkaartje (een denkmodel) van hoe de wereld werkt. Hij weet: "Als ik naar voren loop, kom ik dichter bij de bal." Hij heeft dit geleerd in een kamer zonder obstakels.

Nu gebeurt er iets onverwachts: er staat plotseling een doorzichtige hek (een "paling fence") in zijn weg. Je kunt erdoorheen kijken, maar je kunt er niet doorheen lopen.

Voor de robot is dit een ramp. Hij loopt recht op het hek af, botst er tegen, en zijn verwachtingen gaan volledig mis. Hij dacht dat hij vooruit zou komen, maar hij blijft staan. Dit is waar dit onderzoek over gaat: Hoe leert een robot om zich aan te passen als de regels van de wereld plotseling veranderen, zonder dat hij de oorzaak direct kan zien?

De Oplossing: Een "Geheime Variabele" Erbij Denken

De robot kan de hek niet zien (het is doorzichtig), maar hij voelt wel dat hij vastloopt. In plaats van te blijven botsen, doet de robot iets slim: hij bedacht een nieuw concept in zijn hoofd.

Stel je voor dat je in een auto rijdt en plotseling niet meer kunt versnellen, maar je ziet geen remmen en geen brandstoftekort. Je denkt dan: "Er moet iets zijn dat ik niet zie, wat mijn snelheid blokkeert." De robot doet precies hetzelfde. Hij creëert een verborgen variabele (in het Engels: hidden variable).

Dit is een denkbeeldige "knop" in zijn brein die hij kan zetten op:

  1. Aan: Er is een onzichtbare barrière.
  2. Uit: Alles is normaal.

Omdat de robot niet kan zien waar de barrière zit, moet hij zelf ontdekken dat deze er is, door te kijken naar de gevolgen (hij botst, hij komt niet vooruit).

Het Proces: Van Verrassing naar Strategie

Het onderzoek beschrijft een proces dat in drie stappen verloopt, net als wanneer een mens een nieuwe situatie leert begrijpen:

1. De Verrassing (Surprise)
De robot heeft een "verwachtingsmodel". Hij denkt: "Als ik 2 stappen vooruit ga, ben ik 2 stappen dichter bij het doel."
Wanneer hij botst, is de werkelijkheid anders: "Ik ben nog steeds op dezelfde plek."
Dit verschil tussen wat hij verwachtte en wat er gebeurde, noemen de auteurs Surprise (verrassing). Het is alsof je een bal gooit en die valt niet naar beneden, maar zweeft. Dat is een enorme verrassing voor je brein.

2. Het Detecteren van de Oorzaak
Wanneer de verrassing te groot is, zegt de robot: "Er moet iets zijn dat ik over het hoofd zie."
Hij kijkt naar welke sensoren in de war zijn.

  • Zijn de ogen (visie) in de war? Nee, hij ziet de bal nog steeds.
  • Zijn de voeten (tactiel) in de war? Ja! Hij voelt dat hij stopt.
  • Is de afstand (diepte) in de war? Ja! Hij denkt dat hij dichterbij is, maar is het niet.

De robot concludeert: "Er is een onzichtbare kracht die mijn beweging blokkeert." Hij voegt deze "onzichtbare kracht" toe aan zijn landkaartje als een nieuwe variabele.

3. Het Leren van een Nieuwe Route (Detour)
Nu de robot weet dat er een "onzichtbare muur" is, moet hij zijn strategie aanpassen.

  • Vroeger: Altijd recht vooruit lopen.
  • Nu: Als hij voelt dat hij tegen de muur botst (en de "onzichtbare muur"-knop op 'Aan' staat), leert hij om naast de muur te lopen (zijwaarts stappen) in plaats van er tegenaan te lopen.

Dit noemen ze Learning to Detour (leren om te omzeilen). De robot leert niet alleen dat hij vastloopt, maar leert ook hoe hij eromheen moet gaan.

Waarom is dit belangrijk?

Dit onderzoek is een stap richting Algemene Kunstmatige Intelligentie (AGI).

  • Huidige robots zijn vaak dom: als je hun omgeving verandert (bijvoorbeeld een nieuwe muur), raken ze in de war en stoppen ze.
  • Deze robot is slim: hij kan zelf ontdekken dat de wereld veranderd is, een nieuwe theorie bedenken ("Er is een onzichtbare barrière"), en zijn gedrag aanpassen om het doel toch te bereiken.

Het is alsof een kind dat leert fietsen, ineens een steile helling tegenkomt. In plaats van te stoppen, leert het kind dat het harder moet trappen of een andere route moet nemen. De robot doet dit op basis van wiskunde en waarschijnlijkheid, maar het resultaat is hetzelfde: aanpassingsvermogen.

Samenvattend in één zin:

Deze paper laat zien hoe een robot, wanneer hij op een onzichtbare muur botst, niet in paniek raakt, maar slim genoeg is om te bedenken: "Er is iets dat ik niet kan zien," en vervolgens een nieuwe route uit te stippelen om zijn doel toch te bereiken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →