LCM: Lossless Context Management

Dit artikel introduceert Lossless Context Management (LCM), een deterministische architectuur die het geheugen van LLM's verbetert door middel van recursieve contextcompressie en taakpartitionering, waardoor de Volt-agent lang-context programmeertaken tot 1 miljoen tokens beter presteert dan Claude Code, met garantie van verliesvrije staatsherwinning en beëindiging.

Oorspronkelijke auteurs: Clint Ehrlich, Theodore Blackman

Gepubliceerd 2026-05-07
📖 5 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Clint Ehrlich, Theodore Blackman

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je probeert een massaal, meerdaags mysterie op te lossen. Je hebt een briljante detective (de AI), maar die heeft een zeer kortetermijngeheugen. Als je ze een stapel van 1.000 aanwijzingen geeft, zullen ze de eerste paar vergeten tegen de tijd dat ze bij de laatste aankomen.

Lange tijd was de oplossing om de detective gewoon een groter notitieboek te geven (een groter "contextvenster"). Maar uiteindelijk worden zelfs de grootste notitieboeken te zwaar om te dragen, en begint de detective door de enorme hoeveelheid papier in de war te raken.

Dit paper introduceert een nieuwe manier om de detective te helpen: Lossless Context Management (LCM). Denk hierbij aan het geven van een superintelligente, geautomatiseerde bibliothecaris aan de detective die de notities voor hen beheert, in plaats van de detective te vragen hun eigen archiefsysteem te schrijven.

Hier is hoe het werkt, met eenvoudige analogieën:

1. Het Probleem: De "GOTO" versus "Gestructureerde" Debat

Het paper vergelijkt twee manieren om geheugen te hanteren:

  • De Oude Weg (RLM): Stel je voor dat je de detective vraagt hun eigen archiefsysteem in code te schrijven. Ze moeten beslissen hoe ze de notities organiseren, wanneer ze dingen wegdoen en hoe ze ze later terugvinden. Dit is alsof je een programmeur onbeperkte vrijheid geeft om GOTO-statements te gebruiken (overal in de code springen). Het is krachtig, maar als de detective een fout maakt in hun archiefscript, crasht het hele systeem of wordt het rommelig.
  • De Nieuwe Weg (LCM): In plaats van de detective te vragen het archiefsysteem te schrijven, biedt de engine (de computer die de detective draait) een vooraf gebouwd, perfect archiefkastje. De detective zegt gewoon: "Hier is een nieuwe aanwijzing," en de engine beslist automatisch wanneer oude aanwijzingen samengevat moeten worden en waar ze opgeslagen moeten worden. Dit is alsof je gestructureerde programmering gebruikt (loops en if-statements): het is minder flexibel, maar het crasht nooit door slechte logica.

2. De Twee Magische Hulpmiddelen van LCM

Het paper stelt dat LCM twee hoofdtuigen gebruikt om de detective gefocust te houden:

A. Het "Verliesvrije" Archiefkastje (Hiërarchische DAG)

  • Hoe het werkt: De engine houdt een "Hoofdkopie" van elke enkele notitie, woord voor woord, in een beveiligde kluis (de Immutable Store).
  • De Samenvatting: Om ruimte te besparen in de actieve werkruimte van de detective, maakt de engine een "samenvattingskaart" voor oude notities. Het plaatst de samenvattingskaart in de werkruimte en verbergt de volledige notitie in de kluis.
  • De Magie: Als de detective later de originele notitie nodig heeft, kunnen ze erom vragen, en de engine ruilt de samenvattingskaart direct in voor de volledige notitie. Niets gaat ooit echt verloren; het wordt alleen gecomprimeerd tot het nodig is.
  • Analogie: Stel je voor dat je een boek van 500 pagina's leest. In plaats van het hele boek mee te nemen, draag je een bladwijzer met een samenvatting van één zin per hoofdstuk. Als je een detail moet controleren, sla je terug naar de specifieke pagina in het boek. Je verliest de originele tekst nooit.

B. Het "Parallelle" Team (LLM-Map)

  • Het Probleem: Als de detective 1.000 bestanden één voor één moet lezen, raken ze moe en vergeten ze het eerste bestand tegen de tijd dat ze het laatste bereiken.
  • De Oplossing: In plaats van dat de detective de bestanden zelf leest, fungeert de engine als een baas die 16 assistenten huurt. De detective geeft de baas één instructie: "Lees deze 1.000 bestanden en vertel me het hoofdpunt van elk." De engine stuurt alle 1.000 bestanden gelijktijdig naar de assistenten.
  • Het Resultaat: De assistenten doen het zware werk parallel. De detective ziet alleen de uiteindelijke, georganiseerde lijst met resultaten. De detective hoeft nooit 1.000 bestanden tegelijk in hun hoofd te houden.

3. De "Zero-Cost" Belofte

Een van de grootste claims van het paper is dat dit systeem de dingen niet vertraagt voor kleine taken.

  • Analogie: Als je maar 5 notities hebt om te archiveren, maakt de engine zich geen zorgen om een complex archiefsysteem te creëren. Het laat de detective ze gewoon direct lezen. Het "archiefkastje" springt pas in actie als de stapel te groot wordt. Dit betekent dat voor normale, korte gesprekken het systeem net zo snel aanvoelt als een standaard AI.

4. De Resultaten: De Concurrentie Verslaan

De auteurs testten hun systeem (genaamd Volt) tegen Claude Code, dat momenteel een van de beste AI-coding-assistenten ter wereld is.

  • De Test: Ze gaven beide systemen een massaal "mysterie" met tot wel 1 miljoen woorden aanwijzingen (tokens).
  • De Uitkomst:
    • Voor kleine aanwijzingen (minder dan 32.000 woorden) presteerden beide systemen ongeveer even goed.
    • Voor enorme aanwijzingen (32.000 tot 1 miljoen woorden) won Volt elke keer.
    • Het paper beweert dat Volt aanzienlijk beter was in het vinden van het juiste antwoord in enorme datasets omdat het niet "in de war" raakte door de hoeveelheid tekst, terwijl Claude Code begon te worstelen naarmate de tekst langer werd.

5. Waarom Dit Belangrijk Is (Volgens Het Paper)

Het paper betoogt dat het vragen aan een AI om zijn eigen geheugen te beheren (zoals de "Oude Weg") riskant is omdat AI fouten kan maken in zijn eigen code. Door het geheugenbeheer naar de computer-engine te verplaatsen (de "Nieuwe Weg"), wordt het systeem:

  1. Betrouwbaarder: Het crasht niet omdat de AI een slecht script heeft geschreven.
  2. Efficiënter: Het verwerkt enorme hoeveelheden data zonder dat de AI overweldigd raakt.
  3. Verliesvrij: Het garandeert dat geen enkele informatie ooit echt wordt verwijderd, alleen samengevat.

Kortom, het paper suggereert dat voor zeer lange, complexe taken het beter is om de AI een gestructureerde, geautomatiseerde assistent te geven om het geheugen te behandelen, in plaats van de AI zelf de bibliothecaris te laten zijn.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →