Test-Time Strategies for More Efficient and Accurate Agentic RAG

Dit paper introduceert test-tijdstrategieën voor Agentic RAG die een contextualisatie- en een de-duplicatiemodule combineren om de Search-R1-pijplijn te optimaliseren, wat resulteert in een aanzienlijke verbetering van het antwoordkwaliteit en een vermindering van het aantal noodzakelijke ophaalrondes.

Brian Zhang, Deepti Guntur, Zhiyang Zuo, Abhinav Sharma, Shreyas Chaudhari, Wenlong Zhao, Franck Dernoncourt, Puneet Mathur, Ryan Rossi, Nedim Lipka

Gepubliceerd 2026-03-16
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een kunstmatige intelligentie (AI) een detective is die een moeilijk raadsel moet oplossen. Om dit te doen, moet de AI boeken in een enorme bibliotheek (het internet) raadplegen. Dit proces noemen we RAG (Retrieval-Augmented Generation).

Deze specifieke paper gaat over een nieuwe, slimme detective genaamd Search-R1. Deze detective is getraind om niet direct het antwoord te raden, maar eerst te zoeken, te lezen, en dan pas te antwoorden. Hij doet dit in rondes: Zoek -> Lees -> Denk -> Zoek weer...

Maar de onderzoekers merkten dat deze detective soms wat domme fouten maakt:

  1. Hij vergeet wat hij al gelezen heeft. Hij vraagt om hetzelfde boekje twee keer, alsof hij het net niet heeft gelezen. Dit kost tijd en geld.
  2. Hij kan niet goed samenvatten. Als hij een boekje leest, pakt hij soms de verkeerde zinnen eruit en mist hij het echte antwoord.

In dit paper proberen de onderzoekers de detective te helpen met twee nieuwe hulpmiddelen tijdens het werk (zogenoemde "test-time strategieën"). Ze vergelijken dit met het geven van een slimme assistent aan de detective.

Hier is hoe ze dat doen, uitgelegd met alledaagse vergelijkingen:

1. De "Samenvatter" (Contextualization)

Stel je voor dat de detective een berg krantenknipsels krijgt. In plaats van de hele krant te lezen, roept hij een slimme assistent (een andere AI) die zegt: "Wacht even, ik lees dit snel door en geef je alleen de drie zinnen die echt belangrijk zijn voor je vraag."

  • Het probleem opgelost: De detective hoeft niet meer door 50 pagina's te zoeken; hij krijgt een strakke samenvatting.
  • Het geheugen: De assistent houdt ook een notitieblok bij. Als de detective in de volgende ronde weer iets zoekt, kijkt de assistent eerst: "Hebben we dit al eerder gezien? Ja? Dan hoef je het niet opnieuw te lezen."
  • Het resultaat: De detective werkt sneller en maakt minder fouten omdat hij zich concentreert op de juiste informatie.

2. De "Dubbelparker" (De-duplication)

Stel je voor dat de detective steeds weer hetzelfde boekje uit de bibliotheek haalt, omdat hij denkt dat hij er nog niet genoeg aan heeft. De "Dubbelparker" is een strenge bibliothecaris die zegt: "Stop! Je hebt dat boekje al. Hier is een ander boekje dat je nog niet hebt gezien."

  • Het idee: Forceer de detective om nieuwe dingen te ontdekken in plaats van in een cirkel te draaien.
  • Het verrassende resultaat: Dit klinkt logisch, maar in de praktijk werkte het niet zo goed. De detective werd er verward van. Omdat hij de oude informatie niet meer kon zien (omdat de bibliothecaris het wegnam), probeerde hij nog harder om het antwoord te vinden en vroeg hij nog meer nieuwe boeken. Hij raakte in paniek en werd traag.

3. De "Super-Combinatie" (Hybrid)

Dit is wanneer je de "Samenvatter" én de "Dubbelparker" samenwerkt.

  • De "Samenvatter" zorgt voor een goede leeservaring.
  • De "Dubbelparker" zorgt dat er geen saaie herhalingen zijn.
  • Resultaat: Dit werkt goed, maar de "Samenvatter" alleen bleek de echte winnaar.

Wat was het eindresultaat?

De onderzoekers testten dit op moeilijke vragen (zoals: "Wie is de oom van de schrijver van het boek dat in 1995 won?" – dit vereist meerdere zoekstappen).

  • De winnaar: De detective met de "Samenvatter" (Contextualization).
  • De verbetering: Hij gaf 5,6% meer juiste antwoorden en had 10,5% minder zoekrondes nodig dan de detective zonder hulp.
  • De les: Het helpt niet alleen om meer informatie te verzamelen, maar vooral om die informatie slimmer te verpakken en te onthouden wat je al hebt gezien.

Kortom:
Deze paper leert ons dat een slimme AI niet alleen meer boeken moet kunnen lezen, maar ook moet leren samenvatten en onthouden wat hij al heeft gezien. Door een slimme "assistent" toe te voegen die de informatie voor de AI opdeelt, wordt de AI sneller, goedkoper en slimmer. Het is alsof je een detective niet meer een hele bibliotheek laat doorzoeken, maar hem een samenvatting geeft die hij niet kan vergeten.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →