Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

Het paper introduceert A.DOT, een agentisch framework dat natuurlijke taalvragen over hybride data-meren omzet in gerichte acyclische grafieken (DAG) voor efficiënte, meervoudige redenering en verbeterde nauwkeurigheid door parallelle ophaaloperaties en expliciete bewijslijnen.

Kirushikesh D B, Manish Kesarwani, Nishtha Madaan, Sameep Mehta, Aldrin Dennis, Siddarth Ajay, Rakesh B R, Renu Rajagopal, Sudheesh Kairali

Gepubliceerd 2026-03-17
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je in een gigantisch, chaotisch kantoor werkt. Dit kantoor heeft twee soorten archieven:

  1. De Strakke Tafels: Een enorme verzameling spreadsheets met strakke kolommen (zoals facturen, data, namen). Dit is de gestructureerde data.
  2. De Stapels Papier: Duizenden losse documenten, contracten, e-mails en rapporten die ergens in kasten liggen. Dit is de ongestructureerde data.

Als een manager vraagt: "Wat is de gemiddelde factuurwaarde van klanten uit Texas en wat zijn hun algemene betalingsvoorwaarden?", dan is dat een lastige vraag. Je moet eerst de Excel-tabel in duiken om de Texas-klanten te vinden, en daarna die specifieke papieren contracten zoeken om de betalingsvoorwaarden te lezen.

De meeste huidige systemen doen dit zo: ze gooien de hele vraag naar alle archieven tegelijk, halen alles eruit wat maar een beetje lijkt op "Texas" of "factuur", en hopen dat een slimme computer (een AI) het daarna wel goed bij elkaar kan zetten. Dit is als proberen een naald in een hooiberg te vinden door de hele hooiberg te verbranden. Het is traag, onnauwkeurig en je krijgt veel onzin te zien.

A.DOT: De Slimme Hoofdplanner

De auteurs van dit paper hebben A.DOT bedacht. Dit is een slimme "hoofdplanner" die werkt als een ervaren projectmanager. In plaats van alles door elkaar te halen, doet A.DOT het volgende:

1. De Reisplanner (De DAG)

Stel je voor dat A.DOT een reisplanner is die een routekaart tekent voordat je vertrekt. Deze kaart is een DAG (een grafiek zonder lussen, dus je komt nooit in een cirkel terecht).

  • De planner beseft: "Eerst moeten we de Excel-tabel raadplegen om de klantnummers van Texas te vinden."
  • "Pas daarna, met die nummers, gaan we de papieren contracten zoeken."
  • "Tenslotte rekenen we het gemiddelde uit."

De planner maakt deze stappen in één keer, maar zorgt dat ze slim worden uitgevoerd.

2. De Parallelle Werknemers

In plaats van dat de planner één voor één de stappen doet (wat lang duurt), stuurt hij werknemers (de AI-agenten) erop uit.

  • Werknemer A gaat naar de Excel-tabel.
  • Werknemer B gaat naar de papieren stapels.
  • Als ze onafhankelijk van elkaar kunnen werken, doen ze het tegelijk. Dit bespaart enorm veel tijd.

3. De Slimme Koerier (Variabele Binding)

Dit is het slimste stukje. Als Werknemer A de lijst met Texas-klanten vindt, stuurt hij niet de hele Excel-tabel naar Werknemer B. Dat zou te veel papier zijn om te dragen.
In plaats daarvan stuurt hij alleen de klantnummers (de "sleutels"). Werknemer B gebruikt die nummers om precies de juiste papieren contracten te vinden. Het is alsof je een postbode stuurt met alleen de huisnummers, in plaats van de hele straat te laten overnemen. Dit voorkomt dat er te veel data "lekt" en houdt het systeem snel.

4. De Kwaliteitscontroleur (Validator & DataOps)

Voordat de werknemers vertrekken, kijkt een kwaliteitscontroleur of de routeplaat klopt.

  • "Zijn die kolommen in de Excel-tabel wel echt?"
  • "Begrijpen we de vraag goed?"

Als er een foutje is, springt er een reparatietechnicus (het DataOps-systeem) bij. Die zegt niet alleen "Fout!", maar denkt mee: "Misschien bedoelde je die andere kolom? Laten we het plan even aanpassen en opnieuw proberen." Zo blijft het systeem niet steken bij een klein foutje.

5. De Bewijskracht (Lineage)

Elke keer als A.DOT een antwoord geeft, houdt hij een spoorboekje bij. Je kunt precies zien: "Dit antwoord komt van rij 42 in de Excel-tabel en pagina 3 van het contract."
In een bedrijf is dit cruciaal. Je wilt niet alleen het antwoord, je wilt ook weten waar het vandaan komt, zodat je het kunt verifiëren en controleren.

Waarom is dit beter?

In tests (met een dataset genaamd HybridQA) bleek dat A.DOT veel beter scoort dan de huidige methoden:

  • Meer juistheid: Het geeft 14,8% meer juiste antwoorden.
  • Vollediger: Het vergeet minder belangrijke details (10,7% beter).

Samenvattend:
A.DOT is niet zomaar een zoekmachine die alles door elkaar haalt. Het is een slimme regisseur die een plan maakt, werknemers parallel laat werken, alleen de nodige informatie doorgeeft, fouten direct oplost en altijd kan bewijzen waar het antwoord vandaan komt. Het is de toekomst van het vinden van antwoorden in die grote, hybride data-lakes van bedrijven.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →