DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

DocSage is een end-to-end agentiek framework dat dynamische schema-ontdekking, gestructureerde informatieverwerking en schema-bewuste redenering integreert om de beperkingen van bestaande RAG-systemen bij meerdocumenten-veelentiteiten-vraagbeantwoording te overwinnen en zo aanzienlijk betere nauwkeurigheid te bereiken.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang

Gepubliceerd 2026-03-13
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een detective bent die een complex misdrijf moet oplossen. Je hebt niet één getuige, maar honderden verspreide notities, krantenknipsels en dagboeken van verschillende mensen. De vragen zijn lastig: "Wie werkte samen met wie, en wat was hun motief, gebaseerd op al deze losse stukjes papier?"

Dit is precies het probleem dat DocSage oplost. Het is een slimme digitale assistent (een "agent") die is ontworpen om vragen te beantwoorden door informatie uit veel verschillende documenten en over veel verschillende personen of entiteiten samen te brengen.

Hier is hoe het werkt, vertaald naar alledaagse taal:

Het Probleem: De "Verdwaalde" Informatie

Huidige slimme computers (zoals grote AI-modellen) hebben vaak moeite met deze taak.

  • Ze lezen te veel tekst tegelijk en raken de draad kwijt (net als iemand die een heel boek in één keer probeert te lezen en halverwege de namen van de personages vergeet).
  • Ze zoeken vaak alleen naar woorden die op elkaar lijken, maar missen de echte connecties (bijvoorbeeld: ze vinden het woord "auto", maar zien niet dat "de wagen" in een ander document hetzelfde voertuig is).
  • Ze hebben geen goed overzicht; het is alsof ze proberen een puzzel te leggen zonder de randstukken of de foto op de doos.

De Oplossing: DocSage als de "Super-Detective"

DocSage doet iets heel anders. In plaats van alles blind te lezen, bouwt het eerst een slim kadersysteem (een schema) op maat van de vraag. Het werkt in drie stappen, die we kunnen vergelijken met het opzetten van een goed georganiseerd archief:

1. De Vragensteller (Schema Discovery)

Stel je voor dat je een detective bent die net binnenkomt in een rommelige kamer. In plaats van direct te beginnen met zoeken, vraagt DocSage eerst: "Wat zoek ik precies?"

  • Het systeem stelt slimme vragen aan zichzelf en de documenten om te bepalen welke stukjes informatie echt belangrijk zijn.
  • Analogie: Het is alsof je een detective is die eerst een lijstje maakt van de exacte bewijsstukken die hij nodig heeft (bijv. "Ik moet de namen van de verdachten en hun tijdstippen weten"), voordat hij de hele kamer doorzoekt. Zo vermijdt hij rommel en concentreert hij zich op wat telt.

2. De Ordenaar (Structured Extraction)

Nu het weet wat het zoekt, begint het met het opruimen. Het neemt de chaotische, ongestructureerde tekst en zet het om in nette tabellen, alsof het een Excel-spreadsheet maakt.

  • Het controleert of de informatie klopt. Als er een foutje zit (bijvoorbeeld: iemand is 180 jaar oud), corrigeert het dit automatisch.
  • Analogie: Stel je voor dat je honderden losse post-it notes hebt met aantekeningen. DocSage plakt deze niet zomaar op een muur, maar zet ze in een strak georganiseerd dossier met rijen en kolommen. Als er een foutje staat, zegt het: "Wacht even, dit klopt niet," en zoekt het het juiste antwoord.

3. De Redeneraar (Relational Reasoning)

Met deze nette tabellen kan het nu de vraag beantwoorden. Omdat alle informatie nu in een logisch systeem zit, kan het makkelijk verbindingen leggen tussen verschillende documenten.

  • Het kan zeggen: "In document A staat dat Jan een auto heeft, en in document B staat dat die auto ook bij Piet hoort. Dus Jan en Piet hebben contact."
  • Analogie: Het is alsof je nu niet meer hoeft te bladeren door stapels papier, maar gewoon een database kunt doorzoeken. Je kunt makkelijk zien wie met wie verbonden is, zelfs als die informatie in honderd verschillende documenten verstopt zat.

Waarom is dit zo goed?

De tests in het artikel tonen aan dat DocSage veel beter presteert dan de huidige beste systemen (zoals standaard AI of systemen die alleen zoeken op trefwoorden).

  • Precisie: Het mist geen cruciale feiten.
  • Schaalbaarheid: Het werkt net zo goed met 10 documenten als met 1000 documenten. Terwijl andere systemen de draad kwijtraken als de tekst te lang wordt, blijft DocSage rustig en overzichtelijk.
  • Betrouwbaarheid: Omdat het zijn antwoorden baseert op de strakke tabellen, kun je precies zien waar het antwoord vandaan komt (het kan de "bewijslast" tonen).

Conclusie

DocSage is als het verschil tussen iemand die een rommelige zolder doorzoekt en iemand die eerst een inventarislijst maakt, alles in geordende dozen stopt en vervolgens met een logische lijst de juiste spullen vindt. Het maakt het mogelijk om complexe vragen te beantwoorden over grote hoeveelheden informatie, zonder de draad kwijt te raken.