Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Die Arbeit stellt Memex vor, ein durch Reinforcement Learning (MemexRL) optimiertes, indiziertes Erfahrungsspeichersystem, das die Begrenzung von Kontextfenstern bei langen LLM-Agenten-Aufgaben überwindet, indem es vollständige Interaktionen extern speichert und nur strukturierte Zusammenfassungen sowie stabile Indizes im Arbeitskontext behält, um so den Informationsverlust herkömmlicher Zusammenfassungsmethoden zu vermeiden und die Aufgabenleistung zu steigern.

Zhenting Wang, Huancheng Chen, Jiayun Wang, Wei Wei

Veröffentlicht 2026-03-05
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du bist ein genialer Detektiv, der einen riesigen, komplexen Fall lösen muss. Du hast einen Notizblock (das ist das Gedächtnis des KI-Modells), aber er hat eine sehr seltsame Eigenschaft: Er wird immer größer, je mehr du hineinschreibst, aber er hat eine feste Größe. Wenn er voll ist, musst du entweder alte Seiten zerreißen (und wichtige Beweise verlieren) oder den Fall abbrechen, weil der Block zu schwer wird.

Das ist das Problem, mit dem aktuelle KI-Agenten kämpfen: Sie können lange Aufgaben nicht lösen, weil ihr "Notizblock" (der Kontext) zu voll wird.

Die Forscher von Accenture haben eine Lösung namens Memex entwickelt. Hier ist die Idee, einfach erklärt:

1. Das Problem: Der überfüllte Rucksack

Stell dir vor, du wandertest durch einen Dschungel (eine lange Aufgabe). Du sammelst ständig Gegenstände: einen verrosteten Schlüssel, eine Karte, ein altes Foto, einen Zettel mit einer Telefonnummer.

  • Die alte Methode: Du wirfst alles in deinen Rucksack. Irgendwann ist er so voll, dass du nichts mehr bewegen kannst. Oder du musst Dinge wegwerfen, um Platz zu schaffen. Aber wenn du später den Schlüssel brauchst, hast du ihn vielleicht schon weggeworfen, weil du dachte, er sei nur ein "alter Zettel".
  • Das Ergebnis: Du verlierst den Überblick und scheiterst an der Aufgabe.

2. Die Lösung: Memex (Der intelligente Archiv-Schrank)

Memex ändert das Spiel komplett. Anstatt alles in den Rucksack zu werfen, hast du jetzt zwei Dinge:

  1. Deinen kleinen, handlichen Notizblock (das ist das, was die KI gerade im Kopf hat).
  2. Ein riesiges, geordnetes Archiv (eine externe Datenbank), das unendlich groß ist.

Wie funktioniert das?
Wenn du einen neuen Gegenstand findest (z. B. einen Beweis), tust du folgendes:

  • Du schreibst nicht den ganzen Gegenstand in deinen Notizblock.
  • Stattdessen schreibst du nur eine kurze, präzise Beschreibung und einen Code (einen Index) in deinen Notizblock.
  • Den eigentlichen Gegenstand (das Foto, den Zettel) legst du in das Archiv und hängst den Code daran.

Beispiel:

  • Alt: Du schreibst 5 Seiten lang ab, wie der Schlüssel aussieht, wo er lag und was draufsteht. (Platzverschwendung!)
  • Neu (Memex): Du schreibst nur: "Schlüssel: Code #A123". Der Code #A123 verweist auf das Archiv, wo der Schlüssel perfekt gespeichert ist.

Dein Notizblock bleibt immer klein und übersichtlich. Aber wenn du später den Schlüssel brauchst, schaust du auf deinen Code (#A123), gehst zum Archiv, holst den Schlüssel und legst ihn kurz wieder auf deinen Tisch, um ihn zu benutzen.

3. Der Trainer: MemexRL (Das Lernen durch Belohnung)

Die KI weiß am Anfang nicht, wie sie das gut machen soll. Sie könnte zu viel schreiben oder die falschen Codes vergeben. Deshalb haben die Forscher einen Trainer namens MemexRL entwickelt.

Stell dir vor, du spielst ein Videospiel, bei dem du Punkte verlierst, wenn dein Rucksack zu schwer wird, und Punkte bekommst, wenn du den Fall löst.

  • Der Trainer bestraft die KI, wenn sie zu viel Platz im Notizblock verbraucht.
  • Er belohnt sie, wenn sie den Fall löst, indem sie klug archiviert und zur rechten Zeit aus dem Archiv holt.

Durch dieses Training lernt die KI:

  • Was muss ich aufschreiben? (Nur das Wichtige).
  • Wie nenne ich den Code? (Damit ich ihn später wiederfinde).
  • Wann soll ich etwas aus dem Archiv holen? (Nur wenn es wirklich nötig ist).

4. Warum ist das so cool?

  • Kein Verlust: Bei alten Methoden wurden alte Beweise oft zusammengefasst (wie eine schlechte Zusammenfassung eines Buches), wobei Details verloren gingen. Bei Memex ist der Beweis im Archiv 100% originalgetreu.
  • Unendliche Länge: Da der Notizblock immer klein bleibt, kann die KI Aufgaben lösen, die tausende Schritte dauern, ohne "verwirrt" zu werden.
  • Präzision: Die KI muss nicht raten, was gemeint war. Sie ruft den genauen Code auf und hat sofort das exakte Dokument vor sich.

Zusammenfassung in einem Satz

Memex ist wie ein genialer Assistent, der statt alles im Kopf zu behalten, eine perfekte Aktenordnung im Keller hat und sich nur eine kurze Liste mit "Aktennummern" auf den Schreibtisch legt – und wenn er etwas braucht, holt er die exakte Akte sofort aus dem Keller, ohne den Schreibtisch zu überfluten.

Dank dieser Methode können KI-Agenten jetzt viel längere und schwierigere Aufgaben lösen, ohne den Überblick zu verlieren.