Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents

Deze studie vergelijkt fact-gebaseerde geheugensystemen met lange-context LLM's voor persistente agents en concludeert dat, hoewel lange-context modellen vaak betere feitelijke recall bieden, het geheugenarchitectuur op de lange termijn kostenefficiënter is en een waardevol alternatief biedt voor productiedeployments afhankelijk van de contextlengte en het type taak.

Natchanon Pollertlam, Witchayut Kornsuwannawit

Gepubliceerd 2026-03-06
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Titel: De Herinneringsstrijd: Een Volledig Dagboek versus een Slimme Samenvatting

Stel je voor dat je een zeer intelligente, maar soms vergeetachtige assistent hebt. Je wilt dat deze assistent je helpt, maar hij moet ook onthouden wat je gisteren, vorige week of zelfs maanden geleden hebt gezegd. Hoe doe je dat het beste?

Deze paper vergelijkt twee manieren om die assistent "slim" te maken over de tijd. Het is een gevecht tussen de "Alles-in-één" methode en de "Slimme Notitie" methode.

Hier is wat ze ontdekten, vertaald naar begrijpelijke taal:

1. De Twee Kampioenen

Kampioen A: De "Alles-in-één" methode (Lang Context LLM)
Stel je voor dat je elke keer als je een vraag stelt, de assistent een dik dagboek voor zich krijgt. In dit dagboek staat alles wat je ooit hebt gezegd, letterlijk woord voor woord.

  • Hoe het werkt: De assistent leest het hele dagboek opnieuw om je vraag te beantwoorden.
  • Voordeel: Hij ziet alle details. Hij vergeet niets.
  • Nadeel: Het is zwaar. Hoe langer het dagboek wordt, hoe meer tijd en geld het kost om het elke keer opnieuw te lezen.

Kampioen B: De "Slimme Notitie" methode (Fact-Based Memory)
Stel je voor dat de assistent een klein, slim notitieblok heeft. Elke keer als je iets belangrijks zegt, schrijft hij alleen de kernpunten op (bijv. "Jan houdt van paardrijden" of "Jan werkt bij een bank"). Hij gooit het lange gesprek weg en houdt alleen deze feiten over.

  • Hoe het werkt: Als je een vraag stelt, kijkt hij alleen in zijn kleine notitieblok voor de juiste feiten.
  • Voordeel: Het is supersnel en goedkoop om te lezen, omdat het notitieblok klein blijft.
  • Nadeel: Hij moet eerst het dagboek lezen om de notities te maken. Als hij iets verkeerd samenvat, is de originele tekst weg.

2. Wie wint op "Slimheid" (Nauwkeurigheid)?

De onderzoekers hebben een test gehouden met drie verschillende soorten vragen.

  • Bij complexe verhalen en data: De "Alles-in-één" methode (Kampioen A) wint ruimschoots. Omdat hij het hele dagboek leest, ziet hij subtiele details en verbanden die de "Slimme Notitie" (Kampioen B) misschien over het hoofd heeft gezien bij het samenvatten. Het is alsof je een hele film kijkt in plaats van alleen de bioscoopkrant.
  • Bij persoonlijke voorkeuren: Hier is het een gelijkspel, of Kampioen B wint zelfs een beetje. Als je vraag gaat over "Wat is mijn favoriete koffie?" of "Hoe heet mijn hond?", dan is dat een vast feit. Een klein notitieblok is perfect hiervoor. De assistent hoeft niet het hele dagboek te lezen om te weten dat je van koffie houdt.

Conclusie: Wil je complexe redenering? Kies het dagboek. Wil je persoonlijke details onthouden? De notitie is vaak genoeg.

3. Wie wint op "Geld" (Kosten)?

Dit is waar het echt interessant wordt. De kosten hangen af van hoe vaak je met de assistent praat.

  • Korte gesprekken (1 of 2 keer): De "Alles-in-één" methode is goedkoper. Je betaalt immers alleen voor het lezen van het dagboek. Bij de "Slimme Notitie" moet je eerst betalen om het dagboek te lezen en de notities te maken (de "schrijf-kost"), en dat is bij één vraag te duur.
  • Lange gesprekken (10 keer of meer): Hier wint de "Slimme Notitie" methode handig.
    • Bij de "Alles-in-één" methode moet je elke keer opnieuw betalen voor het lezen van het hele dagboek, zelfs als je alleen een simpele vraag stelt. Het dagboek wordt steeds dikker en duurder.
    • Bij de "Slimme Notitie" heb je al betaald voor het maken van de notities. Nu betaal je alleen een heel klein bedragje om in je kleine notitieblok te kijken.

Het "Breekpunt":
De onderzoekers berekenden dat bij een gesprek van ongeveer 100.000 woorden (een heel dik boek), de "Slimme Notitie" methode na ongeveer 10 vragen goedkoper wordt dan het dagboek. Hoe langer het gesprek duurt, hoe sneller de "Slimme Notitie" wint.

4. Wat betekent dit voor jou?

Deze paper geeft een simpele regel voor bedrijven en ontwikkelaars:

  • Gebruik het "Dagboek" (Alles-in-één) als je eenmalige vragen stelt, of als je extreem nauwkeurige antwoorden nodig hebt over complexe verhalen. Denk aan een eenmalige juridische vraag of het analyseren van één groot document.
  • Gebruik de "Slimme Notitie" als je een assistent hebt die je maandenlang helpt, zoals een persoonlijke trainer, een klantenservice-bot die je vaak belt, of een tutor. Hier bespaar je veel geld, en de assistent blijft toch goed genoeg voor het onthouden van jouw persoonlijke voorkeuren.

Samengevat in één zin:
Voor korte, complexe taken is het lezen van het hele dagboek het beste; voor lange, persoonlijke relaties is het hebben van een slim, samengevat notitieblok de winnaar op zowel geld als tijd.