Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Deze paper introduceert MIKASA, een uitgebreide benchmark voor het evalueren van geheugenvermogens in versterkingslering, met name gericht op complexe robotmanipulatie taken.

Egor Cherepanov, Nikita Kachaev, Alexey K. Kovalev, Aleksandr I. Panov

Gepubliceerd 2026-03-05
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Titel: MIKASA: De "Geheugentrainer" voor Robots

Stel je voor dat je een robot wilt bouwen die niet alleen kan bewegen, maar ook echt begrijpt wat er om hem heen gebeurt. Je wilt dat hij een taak kan uitvoeren waarbij hij dingen moet onthouden, zoals: "Ik heb net een rode bal onder een kopje gezien, maar nu zijn de kopjes verplaatst. Waar zit de bal nu?"

Dit is waar het probleem zit. Veel robots zijn slim in het moment, maar ze hebben een kort geheugen. Ze vergeten wat er vijf seconden geleden gebeurde. Wetenschappers wilden dit testen, maar ze hadden geen goede manier om te zeggen: "Deze robot heeft een goed geheugen, die andere niet." Het was alsof je twee mensen wilt testen op hun geheugen, maar je geeft ze allebei een heel ander soort puzzel. Dan kun je niet vergelijken wie beter is.

De Oplossing: MIKASA
De auteurs van dit paper hebben MIKASA bedacht. Dit is een soort "olympiade" of een uitgebreide testset voor robotgeheugen. Ze hebben een heel systeem bedacht om te meten hoe goed robots kunnen onthouden.

Hier is hoe het werkt, vertaald naar alledaagse termen:

1. De Vier Soorten "Geheugen-oefeningen"

De auteurs hebben alle geheugentaken ingedeeld in vier categorieën, net zoals je in een sportschool verschillende spiergroepen traint:

  • Object-geheugen (De "Verdwijntruc"): Stel je voor dat je een muis onder een doekje legt en het doekje verschuift. De robot moet onthouden dat de muis er nog steeds is, ook al kan hij hem niet zien. Dit heet objectpermanentie.
  • Ruimtelijk geheugen (De "Kaart in je hoofd"): Je loopt door een huis met de lichten uit. Je moet onthouden waar de stoel stond zodat je er niet tegenaan loopt. De robot moet onthouden waar objecten stonden in de ruimte.
  • Sequentieel geheugen (De "Recept"): Je moet een soep maken. Eerst de wortel, dan de aardappel, dan de tomaat. Als je de volgorde vergeet, is het een soep van rommel. De robot moet de volgorde van acties onthouden.
  • Geheugencapaciteit (De "Werkgeheugen-test"): Je krijgt een lijst met 7 namen te horen en moet ze allemaal onthouden. Hoe meer items, hoe zwaarder het is. De robot moet veel verschillende dingen tegelijk onthouden.

2. De Test: MIKASA-Robo

Ze hebben 32 verschillende robot-taken bedacht om deze vaardigheden te testen. Hier zijn een paar voorbeelden uit hun "speelgoeddoos":

  • Het Schelpenspel (Shell Game): Net als in de kermis. Er is een balletje onder een van de drie kopjes. De robot kijkt ernaar, dan worden de kopjes gedraaid. De robot moet het juiste kopje aanraken.
  • Kleuren Onthouden: De robot ziet een rode kubus. Dan verdwijnt hij. Later verschijnen er 9 kubussen van verschillende kleuren. De robot moet de rode kubus weer vinden.
  • Het Terugbrengen: De robot duwt een blokje naar een doelwit. Dan moet hij het blokje terugduwen naar de plek waar hij het oorspronkelijk vond, zelfs als hij de startplek niet meer ziet.

3. Wat hebben ze ontdekt? (De Teleurstellende Nieuws)

Ze hebben deze tests gedaan met de slimste robots en AI-modellen van vandaag (zoals die grote taalmodellen die ook tekst kunnen schrijven). Het resultaat? Ze zakken er doorheen.

  • De "Korte-termijn" robots: Robots die geen specifiek geheugen hebben (zoals een standaard robotarm), kunnen de simpele dingen wel, maar zodra er iets moet worden onthouden, raken ze in de war.
  • De "Slimme" robots: Zelfs de allermodernste AI-modellen (die vaak worden geprezen om hun intelligentie) faalden volledig zodra de taak een beetje langdurig geheugen vereiste. Ze konden de kleur van een blokje niet onthouden als er een paar seconden tussen zaten.
  • Het probleem: Het lijkt erop dat deze robots "nu" heel goed zijn, maar ze hebben geen manier om informatie vast te houden voor later. Het is alsof je een briljant iemand vraagt om een telefoonnummer te onthouden, maar je mag geen pen en papier gebruiken en je mag niet hardop herhalen.

4. Waarom is dit belangrijk?

Voor nu zijn robots vooral goed in simpele taken in een stille kamer. Maar in het echte leven is alles chaotisch.

  • Een service-robot moet onthouden dat er een bord onder een handdoek ligt.
  • Een huishoudrobot moet onthouden dat hij de deur van de magnetron al drie keer heeft schoongemaakt, zodat hij niet eindeloos blijft doorgaan.

Zonder een goed geheugen zijn robots niet echt nuttig in onze complexe wereld.

Conclusie in één zin:
De auteurs hebben een nieuwe "rijbewijstest" (MIKASA) gemaakt voor robots om te zien of ze kunnen onthouden, en ze hebben ontdekt dat onze huidige slimme robots eigenlijk nogal vergeetachtig zijn. Ze hebben de test openbaar gemaakt zodat andere wetenschappers nu kunnen proberen robots te bouwen die écht kunnen onthouden, net als wij mensen.

Kortom: MIKASA is de test die laat zien dat robots nog moeten leren "niet te vergeten" voordat ze onze huishoudelijke taken echt over kunnen nemen.