Human-like Working Memory Interference in Large Language Models

Hua-Dong Xiong (School of Psychological and Brain Sciences, Georgia Tech), Li Ji-An (Department of Psychology, New York University), Jiaqi Huang (Department of Cognitive Science, Indiana University Bloomington, Honda Research Institute), Robert C. Wilson (School of Psychological and Brain Sciences, Georgia Tech, Center of Excellence for Computational Cognition, Georgia Tech), Kwonjoon Lee (Honda Research Institute), Xue-Xin Wei (Departments of Neuroscience and Psychology, The University of Texas at Austin)

Publié 2026-04-14

📖 5 min de lecture🧠 Analyse approfondie

Voir sur arXiv ↗PDF ↗

Each language version is independently generated for its own context, not a direct translation.

🧠 Le Mémoire de Travail des IA : Pourquoi les Géants Numériques Ont-ils la Tête Vide ?

Imaginez que vous demandez à un ami très intelligent de vous répéter la lettre que vous avez dite il y a trois phrases. Si vous lui donnez une liste de 50 lettres à retenir, même le plus brillant d'entre nous commence à faire des erreurs. C'est ce qu'on appelle la mémoire de travail : la capacité à garder des informations en tête pendant qu'on les utilise.

Ce papier de recherche pose une question fascinante : Pourquoi les grands modèles de langage (les IA comme moi), qui ont des milliards de "neurones" et qui peuvent relire tout ce que vous avez écrit précédemment, échouent-ils aussi à cette tâche simple ?

Voici les découvertes clés, expliquées avec des analogies du quotidien.

1. Le Paradoxe de la Bibliothèque Infinie

Imaginez que l'IA est une bibliothécaire dans une bibliothèque gigantesque où chaque livre (chaque mot que vous avez dit) est rangé parfaitement. Théoriquement, elle devrait pouvoir trouver n'importe quel livre instantanément en regardant juste l'étiquette de la date.

Le problème : Même si elle a accès à toute la bibliothèque, quand on lui demande de se souvenir de ce qui s'est passé il y a 3 ou 4 tours de conversation, elle se trompe.
La découverte : Les chercheurs ont prouvé qu'une petite IA simple peut apprendre à faire cela parfaitement. Donc, le problème n'est pas qu'elle "ne voit pas" l'information. Le problème est qu'elle oublie ou se confond avec les autres informations.

2. L'Analogie du "Bruit de Fond" (L'Interférence)

C'est le cœur de la découverte. Imaginez que vous essayez d'écouter une conversation spécifique dans une pièce remplie de 20 autres personnes qui parlent toutes en même temps.

Ce que l'IA fait : Au lieu de simplement "lire" le mot qu'elle doit répéter, elle entend tous les mots récents en même temps. Les mots récents (ceux qu'elle vient de voir) crient très fort et couvrent le mot qu'elle devrait retenir.
L'erreur humaine : C'est exactement comme chez nous ! Si on vous demande de répéter un mot, vous avez tendance à répéter le dernier mot que vous avez entendu (l'effet de récence) plutôt que celui qu'on vous a demandé. L'IA fait la même chose : elle est "polluée" par le bruit des informations récentes.

3. Le Mécanisme Secret : Le "Filtre de Sécurité"

Les chercheurs ont regardé à l'intérieur du cerveau de l'IA (ses couches de traitement) pour voir comment elle gère ce bruit. Ils ont découvert un processus en trois étapes, comme un chef d'orchestre qui tente de calmer une foule :

Le Chaos initial : Au début, toutes les lettres (les souvenirs) sont mélangées dans un grand tas. C'est le bazar.
Le Tri (Le milieu du processus) : L'IA commence à séparer les souvenirs. Elle essaie de mettre les lettres "inutiles" dans un coin pour qu'elles ne gênent pas. C'est comme si elle disait : "Toi, la lettre A, tais-toi un peu, je dois me concentrer sur la lettre Z".
La Réunion finale (La fin du processus) : Juste avant de répondre, elle rassemble tout à nouveau pour sortir la bonne lettre.

Le problème : Plus il y a de lettres à retenir, plus le "tas" est gros, et plus l'IA a de mal à isoler la bonne lettre du bruit ambiant. Elle ne copie pas simplement le mot ; elle doit le dégager du brouillard des autres mots.

4. Le Lien avec l'Intelligence Générale

C'est la partie la plus surprenante. Les chercheurs ont remarqué une corrélation simple :

Les modèles d'IA qui sont meilleurs pour résister à ce bruit (pour faire ce jeu de mémoire) sont aussi ceux qui sont plus intelligents pour répondre à des questions complexes, faire du raisonnement ou suivre des instructions.

C'est comme si la capacité à "se concentrer" et à ignorer les distractions était la clé de l'intelligence, aussi bien pour les humains que pour les machines. Ce n'est pas juste une question de taille de cerveau, mais de capacité à filtrer.

5. L'Expérience Magique : "Nettoyer" le Cerveau

Pour prouver leur théorie, les chercheurs ont fait une expérience un peu bizarre : ils ont pris l'IA et lui ont "arraché" mentalement la capacité de se souvenir de l'identité exacte des lettres (le bruit), en ne lui laissant que la position.

Résultat : L'IA s'est améliorée ! En enlevant le "bruit" des lettres inutiles, elle a mieux réussi le jeu de mémoire.
Conclusion : Cela prouve que le problème n'était pas qu'elle ne trouvait pas l'information, mais qu'elle était distraite par les mauvaises informations.

En Résumé

Cette étude nous dit que les IA ne sont pas limitées par leur manque de mémoire (elles ont accès à tout), mais par leur difficulté à se concentrer.

Tout comme nous, les humains, les IA luttent contre l'interférence : elles doivent apprendre à supprimer les informations inutiles pour accéder à l'information importante. C'est un défi de "gestion du bruit" et non de "stockage".

La leçon pour le futur ? Pour rendre les IA plus intelligentes, il ne suffit pas de leur donner plus de mémoire ou de plus gros contextes. Il faut peut-être apprendre à mieux les entraîner à ignorer le bruit et à se concentrer sur l'essentiel, exactement comme nous le faisons quand nous essayons de nous souvenir d'un numéro de téléphone dans un café bruyant.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique et Contexte

Les systèmes intelligents doivent maintenir et manipuler des informations pertinentes pour la tâche en temps réel afin de s'adapter à des environnements dynamiques. Cette capacité, appelée mémoire de travail, est fondamentale pour le raisonnement humain et l'intelligence. Cependant, tant les systèmes biologiques que les systèmes artificiels (comme les grands modèles de langage ou LLM) présentent des limites sévères dans ce domaine.

Le paradoxe central soulevé par l'article est le suivant : alors que les LLMs possèdent des centaines de milliards de paramètres et un accès direct à l'intégralité du contexte précédent via le mécanisme d'attention, ils échouent systématiquement sur des tâches de mémoire de travail (comme le test N-back) lorsque la charge cognitive augmente. Pourquoi ces modèles, capables de théoriquement "voir" tout le passé, ne peuvent-ils pas simplement extraire l'information pertinente ?

L'hypothèse centrale de l'article est que ces limitations ne proviennent pas d'un manque de capacité de stockage ou d'accès, mais d'un problème de contrôle de l'interférence. Les représentations distribuées et entrelacées des modèles créent des interférences entre les éléments de mémoire, rendant la récupération de l'élément cible difficile en présence d'éléments concurrents.

2. Méthodologie

Les auteurs ont conçu une série d'expériences rigoureuses pour tester cette hypothèse :

Tâche Expérimentale : Adaptation du test N-back (un paradigme standard en psychologie cognitive) pour les LLMs. Dans chaque essai, le modèle reçoit une séquence de lettres (50 tours) et doit produire la lettre présentée $N$ tours auparavant. Les valeurs de $N$ testées sont 1, 2, 3 et 4.
Modèles Évalués : Une diversité de 10 modèles pré-entraînés et ajustés (instruction-tuned) provenant de quatre familles (Gemma 3, Qwen 3.5, Llama-3.1, Ministral 3), couvrant une gamme de tailles de 1B à 27B de paramètres.
Conditions d'Évaluation :
- Mode Autoregressif : Le modèle génère ses propres réponses, permettant l'accumulation d'erreurs.
- Mode Teacher-Forcing : Les réponses précédentes sont fournies par la vérité terrain (ground-truth), isolant ainsi la capacité de récupération de la génération.
Manipulations Comportementales : Pour distinguer une récupération purement positionnelle d'une récupération sensible au contenu, les auteurs ont introduit :
- Des leurres (lure stimuli) : des lettres qui apparaissent à des positions $N-1$ ou $N+1$ .
- Une réduction de la taille de l'ensemble des stimuli (de 26 à 10 lettres).
- Des structures de transition séquentielles (chaînes de Markov) pour tester la sensibilité aux statistiques du contenu.
Analyse Mécanistique :
- Analyse des représentations internes (états cachés) à travers les couches du transformateur.
- Mesure de l'alignement des représentations avec l'identité des lettres (stimulus) et la position relative.
- Intervention Causale : Suppression sélective des directions d'information liées à l'identité des lettres dans le flux résiduel (residual stream) pour observer l'impact sur la performance.

3. Contributions Clés et Résultats

A. Limites de la mémoire de travail et signatures d'interférence

Contrairement à un petit transformateur entraîné spécifiquement sur la tâche (qui résout le N-back à 100 %), les LLMs pré-entraînés montrent une baisse de performance significative à mesure que $N$ augmente.

Interférence de récence : Les erreurs ne sont pas aléatoires ; elles sont biaisées vers les éléments de mémoire les plus récents (non cibles), imitant les effets d'interférence observés chez l'humain.
Biais basés sur le contenu : La performance est affectée par la similarité des leurres, la taille de l'ensemble de stimuli et les statistiques de transition. Cela prouve que le modèle ne se contente pas de lire une "position" pure, mais que le contenu sémantique des autres éléments interfère avec la cible.

B. Corrélation avec l'intelligence générale

Les auteurs ont découvert une corrélation significative entre la capacité de mémoire de travail (performance au N-back) et les performances sur des benchmarks généraux de raisonnement et de suivi d'instructions (MMLU Pro, GPQA Diamond, IFEval). Cela suggère que le contrôle de l'interférence est une compétence fondamentale liée à l'intelligence, tant pour les humains que pour les LLMs.

C. Mécanisme computationnel commun

L'analyse des représentations internes révèle une trajectoire commune à travers les couches des modèles :

Suppression progressive : L'information sur l'identité des lettres (stimulus) est progressivement supprimée à travers les couches pour réduire l'interférence.
Séparation des sous-espaces : Les représentations des différents éléments de mémoire deviennent plus distinctes (moins de similarité de sous-espace) dans les couches intermédiaires.
Alignement tardif : L'alignement entre la représentation de l'élément cible et les poids de lecture (readout weights) ne se produit que dans les dernières couches.
Ce mécanisme indique que le modèle doit activement "nettoyer" le contexte des éléments non pertinents pour isoler la cible, plutôt que de simplement pointer vers elle.

D. Preuve Causale

L'intervention consistant à supprimer les directions d'information liées à l'identité des lettres dans le flux résiduel a amélioré la performance au N-back. Cela démontre de manière causale que l'information sur l'identité des lettres non cibles est une source d'interférence qui nuit à la récupération de la cible.

4. Signification et Implications

Nature des Limites des LLMs : Les limites de mémoire des LLMs ne sont pas dues à un manque d'accès aux données passées, mais à une difficulté computationnelle à sélectionner l'information pertinente au sein de représentations entrelacées et interférentes.
Convergence Biologique-Artificielle : Les LLMs et les humains partagent un défi computationnel similaire : gérer l'interférence dans des représentations distribuées. Cela suggère que les limites de la mémoire de travail pourraient être une contrainte fondamentale de tout système intelligent utilisant des représentations partagées pour une généralisation rapide.
Perspectives Futures : Améliorer la mémoire des LLMs ne nécessitera pas seulement d'augmenter la taille de la fenêtre de contexte, mais probablement d'optimiser les mécanismes de récupération sélective et de contrôle de l'interférence. Cela ouvre la voie à de nouvelles architectures ou techniques d'entraînement visant à mieux séparer les représentations des tâches pertinentes des distracteurs.

En conclusion, cet article établit que les limitations de la mémoire de travail dans les LLMs sont un phénomène d'interférence représentational, structuré de manière similaire à la cognition humaine, et que la maîtrise de cette interférence est un indicateur clé des capacités générales du modèle.