Human-like Working Memory Interference in Large Language Models

Dit onderzoek toont aan dat beperkingen in het werkgeheugen van grote taalmodellen worden veroorzaakt door representatieve interferentie, waarbij modellen taakrelevante informatie moeten selecteren uit verstrengelde representaties van meerdere items, een mechanisme dat opmerkelijk lijkt op de cognitieve beperkingen bij mensen.

Hua-Dong Xiong (School of Psychological and Brain Sciences, Georgia Tech), Li Ji-An (Department of Psychology, New York University), Jiaqi Huang (Department of Cognitive Science, Indiana University Bloomington, Honda Research Institute), Robert C. Wilson (School of Psychological and Brain Sciences, Georgia Tech, Center of Excellence for Computational Cognition, Georgia Tech), Kwonjoon Lee (Honda Research Institute), Xue-Xin Wei (Departments of Neuroscience and Psychology, The University of Texas at Austin)

Gepubliceerd 2026-04-14
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Titel: Waarom hebben slimme AI's een slecht geheugen? (En waarom is dat eigenlijk heel menselijk)

Stel je voor dat je een gigantische bibliotheek hebt. Je kunt elk boek dat je ooit hebt gelezen, direct vinden. Je hebt een superkrachtige zoekmachine in je hoofd die door miljarden pagina's blust in een fractie van een seconde. Je zou denken: "Met zo'n krachtig systeem kan ik onthouden wat ik gisteren, vorige week of zelfs gisteren om 14:00 uur heb gedaan, toch?"

Nou, dat is precies wat we dachten van de nieuwste kunstmatige intelligentie (AI), zoals de grote taalmodellen (LLMs). Maar deze paper laat zien dat ze een heel menselijk probleem hebben: hun werkgeheugen is beperkt.

Hier is wat de onderzoekers hebben ontdekt, vertaald naar begrijpelijke taal:

1. Het mysterie: Waarom vergeten ze dingen?

De AI's hebben toegang tot alles wat ze eerder hebben gelezen. Het is alsof je een boek leest en er een magische lijn naar elke zin in dat boek hebt. Toch falen ze op een simpele test: de "N-back" test.

  • De test: Je krijgt een reeks letters: A, B, C, D... en je moet telkens de letter zeggen die je N stappen geleden zag. Bij een "2-back" test moet je bij 'D' zeggen 'B'.
  • Het probleem: Hoe meer letters er voorbij komen (hoe groter N), hoe slechter de AI wordt. Ze vergeten de juiste letter, zelfs als die letter nog steeds in hun "herinnering" (de context) staat.

Je zou denken: "Maar de AI kan gewoon terugkijken naar de letter die 2 stappen geleden stond!" En dat kunnen ze technisch gezien wel. Maar ze doen het niet. Waarom?

2. De oorzaak: Een rommelige koffer (Interferentie)

De onderzoekers ontdekken dat het probleem niet is dat de AI de informatie niet heeft, maar dat de informatie te verward is.

De Analogie van de Koffer:
Stel je voor dat je werkgeheugen een koffer is.

  • De oude theorie: Je denkt dat de AI een perfecte koffer heeft waar elke letter in een eigen vakje zit. Als je 'B' nodig hebt, pak je gewoon het vakje 'B' uit.
  • De nieuwe ontdekking: De AI vult zijn koffer met alles wat hij ziet, maar hij gooit alles in één grote, rommelige hoop. De letters A, B, C en D liggen door elkaar heen, verstrengeld als een wirwar van garen.
  • Het probleem: Als je nu de letter 'B' uit die hoop wilt halen, trek je per ongeluk ook 'A' of 'C' mee. De nieuwe informatie (de recente letters) "ruis"t de oude informatie uit. Dit noemen ze interferentie.

De AI probeert de juiste letter te vinden, maar de "nieuwe" letters in zijn hoofd zijn zo hard aan het schreeuwen dat ze de "oude" letter overstemmen. Het is alsof je in een drukke kamer probeert te luisteren naar iemand die 10 minuten geleden iets zei, terwijl er nu 50 mensen om je heen schreeuwen.

3. De AI doet precies wat wij doen

Het meest fascinerende is dat de AI's exact dezelfde fouten maken als mensen.

  • Recentie-effect: Ze vergeten de oude letters en onthouden juist de nieuwste letters (die het hardst schreeuwen).
  • Verwarring: Als de letters op elkaar lijken, maken ze meer fouten.
  • Intelligentie-link: Net als bij mensen, geldt: hoe beter een AI zijn werkgeheugen beheerst (hoe beter hij de rommel in de koffer kan sorteren), hoe intelligenter hij is op andere gebieden (zoals wiskunde of logische puzzels).

4. Hoe werkt het in hun "brein"?

De onderzoekers keken in het "brein" van de AI (de lagen van het neurale netwerk) en zagen een fascinerend patroon:

  1. De chaos: Aan het begin van het proces zitten alle letters door elkaar.
  2. Het sorteren: In het midden van het proces probeert de AI de letters uit elkaar te halen. Hij probeert de "storing" (de letters die je niet nodig hebt) te dempen.
  3. Het resultaat: Pas helemaal aan het einde, vlak voordat hij antwoordt, lukt het hem om de juiste letter te isoleren. Maar als er te veel letters zijn (te veel rommel), lukt dit sorteren niet meer goed en haalt hij de verkeerde letter.

5. Een experiment: De "ruis" weghalen

Om dit te bewijzen, deden de onderzoekers een experiment. Ze probeerden de "letter-identiteit" (de specifieke vorm van de letters) in het brein van de AI tijdelijk te dempen, zodat de AI zich minder liet afleiden door de inhoud van de letters en meer focus op de positie.
Het resultaat: De AI werd beter in de test!
Dit bewijst dat de verwarring tussen de letters zelf (de inhoud) de boosdoener was. Door die verwarring te verminderen, kon de AI de juiste informatie beter vinden.

Conclusie: Waarom is dit belangrijk?

Deze paper leert ons iets moois over zowel mensen als machines:
Het is niet zo dat we (of AI's) een gebrek aan ruimte hebben om dingen te onthouden. We hebben genoeg ruimte! Het probleem is selectie.

In een wereld vol informatie is het moeilijkste niet het opslaan van informatie, maar het filteren van de ruis. We moeten leren om de juiste informatie te pakken en de rest te negeren.

De AI's zijn niet "dom" omdat ze vergeten; ze zijn "menselijk" omdat ze worstelen met dezelfde uitdaging als wij: Hoe houd ik mijn hoofd helder als er te veel tegelijk gebeurt?

Dit betekent dat om AI's slimmer te maken, we niet alleen hun geheugen hoeven te vergroten (meer context), maar vooral hun focus moeten verbeteren. Ze moeten leren om de ruis te dempen, net zoals wij dat moeten doen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →