SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation

Het artikel introduceert SPD-RAG, een hiërarchisch multi-agent framework dat complexe vragen over meerdere documenten beantwoordt door elk document te laten verwerken door een gespecialiseerd agent, wat resulteert in een aanzienlijke verbetering van de antwoordkwaliteit en schaalbaarheid ten opzichte van bestaande RAG-methoden.

Yagiz Can Akay, Muhammed Yusuf Kartal, Esra Alparslan, Faruk Ortakoyluoglu, Arda Akpinar

Gepubliceerd Tue, 10 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een heel groot raadsel moet oplossen, maar de aanwijzingen zijn verspreid over honderden verschillende boeken in een enorme bibliotheek. Als je één persoon vraagt om al die boeken in één keer te lezen en het antwoord te vinden, wordt die persoon snel overweldigd. Ze raken de draad kwijt, missen belangrijke details of vergeten wat er in boek 50 stond terwijl ze boek 100 lezen.

Dit is precies het probleem dat moderne kunstmatige intelligentie (AI) heeft als het moet zoeken in enorme documenten. De nieuwe methode uit dit paper, genaamd SPD-RAG, lost dit op met een slimme aanpak die we kunnen vergelijken met een professioneel detective-team.

Hier is hoe het werkt, in simpele taal:

1. De oude manier: De "Alles-weet-alleen" Detective

Stel je een enkele detective voor die alle boeken in de bibliotheek moet doorzoeken.

  • Het probleem: Als er 100 boeken zijn, kan de detective niet alles tegelijk onthouden. Hij pakt misschien de eerste 10 boeken, leest die, en denkt: "Oké, hier is het antwoord." Maar hij mist de cruciale aanwijzing die in boek 95 stond.
  • De consequentie: Het antwoord is vaak onvolledig of foutief.

2. De SPD-RAG manier: Het Detective-Team

In plaats van één detective, sturen we een hoofdinspecteur en een team van gespecialiseerde agenten.

  • De Hoofdinspecteur (De Coördinator):
    Deze persoon krijgt de vraag van de klant. Hij denkt niet zelf het antwoord uit, maar beseft: "Dit is een complex probleem. We moeten dit opsplitsen." Hij maakt een duidelijke lijst met instructies: "Jullie moeten allemaal zoeken naar specifieke cijfers en namen in jullie eigen boek."

  • De Gespecialiseerde Agenten (De Sub-agenten):
    Nu gebeurt het magische: Elk boek krijgt zijn eigen detective.

    • Agent A kijkt alleen naar Boek 1.
    • Agent B kijkt alleen naar Boek 2.
    • Agent C kijkt alleen naar Boek 3.

    Omdat Agent A alleen naar Boek 1 hoeft te kijken, kan hij zich volledig concentreren. Hij leest het boek tot in de kleinste details, zoekt naar elke aanwijzing die relevant is, en maakt een beknopt verslag. Hij hoeft zich geen zorgen te maken over wat er in de andere boeken staat. Dit gebeurt allemaal tegelijkertijd (paralell), dus het duurt niet langer dan het lezen van één boek.

  • De Samenvoeger (De Synthese-laag):
    Als alle agenten hun verslagen hebben ingeleverd, neemt de Hoofdinspecteur deze stukjes informatie en plakt ze samen tot één groot, compleet verhaal.

    • Als het verslag te lang wordt, gebruikt hij een slimme truc: hij groepeert de meest vergelijkbare stukjes informatie eerst en vat die samen, net zoals je een berg losse puzzelstukken eerst in kleine groepjes sorteert voordat je ze tot één plaatje maakt.

Waarom is dit zo slim?

  1. Geen vergeten details: Omdat elke agent zich alleen op één document richt, wordt er niets over het hoofd gezien. Het is alsof je 100 mensen vraagt om elk één pagina van een boek te controleren, in plaats van één persoon die het hele boek moet scannen.
  2. Kostenbesparing: Het is goedkoper om 100 kleine, snelle detectives (die minder "hersencapaciteit" nodig hebben) te betalen dan één super-detective die urenlang moet nadenken over alles. In de paper blijkt dat deze methode 76% betere antwoorden geeft dan de oude methoden, maar slechts 38% van de kosten kost van de duurste manier.
  3. Schaalbaarheid: Of je nu 10 of 10.000 boeken hebt, het systeem werkt hetzelfde. Je geeft gewoon een nieuwe agent een nieuw boek.

De Resultaten in het Kort

De onderzoekers hebben dit getest op een moeilijke test (het "Loong"-benchmark), waarbij AI moest antwoorden op vragen over financiële rapporten en wetenschappelijke artikelen.

  • De oude AI: Haalde een score van ongeveer 33 (van 100).
  • De nieuwe SPD-RAG: Haalde een score van 58.
  • De "Perfecte" AI (die alles in één keer leest): Haalde 68, maar kostte bijna drie keer zoveel geld en tijd.

Conclusie:
SPD-RAG leert ons dat voor complexe vragen niet "meer kracht" (een grotere AI die alles in één keer leest) de oplossing is, maar slimmer werken. Door het werk op te splitsen in kleine, gespecialiseerde taken en die later slim samen te voegen, krijg je een veel accurater antwoord voor een fractie van de prijs. Het is de kracht van samenwerking in plaats van eenzame heldenmoed.