DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

Dit paper introduceert DataFactory, een collaboratief multi-agent framework dat de beperkingen van bestaande Large Language Models voor tabelvraagbeantwoording overwint door gespecialiseerde agententeams te coördineren voor geautomatiseerde kennisomzetting en adaptieve planning, wat leidt tot aanzienlijke verbeteringen in nauwkeurigheid en betrouwbaarheid.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang Zhao

Gepubliceerd Wed, 11 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, rommelige schuur hebt vol met dozen, lijsten en kaarten. Je wilt er een antwoord op een vraag uit halen, bijvoorbeeld: "Welke sporten werden er op de Wereldkampioenschappen jeugd beoefend en wie waren de beste atleten?"

Als je dit aan een enkele slimme robot (een 'AI') vraagt, kan het misgaan. De robot probeert alles in één keer te onthouden, raakt de draad kwijt in de chaos, of verzint feiten die er niet zijn (dit noemen we 'hallucinaties').

De auteurs van dit paper hebben een oplossing bedacht genaamd DataFactory. In plaats van één robot, hebben ze een gespecialiseerd team opgericht dat samenwerkt als een goed georganiseerd kantoor. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De Drie Hoofdpersoonnen in het Team

Het systeem bestaat uit drie hoofdrollen die perfect op elkaar zijn afgestemd:

  • De Chef (De Data Leader):
    Dit is de manager. Hij luistert naar jouw vraag en beseft direct: "Dit is te ingewikkeld voor één persoon." Hij deelt het werk uit. Hij gebruikt een slimme methode (ReAct) waarbij hij eerst nadenkt, dan actie onderneemt, en daarna kijkt of het resultaat klopt voordat hij verder gaat. Hij is de regisseur die zorgt dat iedereen op zijn plek zit.

  • De Boekhouder (Het Database Team):
    Deze groep is gespecialiseerd in strakke lijsten, tabellen en rekenen. Ze zijn goed in het beantwoorden van vragen als: "Hoeveel geld hebben we verdiend in maart?" of "Wie heeft de hoogste score?" Ze praten de taal van databases (SQL). Ze zijn precies, snel en houden van getallen.

  • De Ontdekkingsreiziger (Het Kennisgraph Team):
    Deze groep is gespecialiseerd in verbanden en netwerken. Ze kijken niet alleen naar lijsten, maar naar hoe dingen met elkaar verbonden zijn. Ze beantwoorden vragen als: "Wie werkt samen met wie?" of "Welke sporten hangen samen met welke landen?" Ze gebruiken een soort 'stippellijn-kaart' (een Kennisgraph) om verborgen paden te vinden die de boekhouder niet ziet.

2. Hoe werken ze samen? (De Creatieve Analogie)

Stel je voor dat je een detective bent die een complex misdrijf moet oplossen.

  • De oude manier: Je stuurt één detective de zaak in. Die probeert alles zelf te onthouden, schrijft alles op een briefje en hoopt dat hij het niet vergeet. Vaak raakt hij de draad kwijt of verzint hij details.
  • De DataFactory-methode: De Chef (Data Leader) roept twee specialisten bij elkaar.
    1. Hij vraagt de Boekhouder: "Kijk in de administratie, welke verdachten hadden contact met het slachtoffer?"
    2. Hij vraagt de Ontdekkingsreiziger: "Kijk op de kaart, welke verdachten hebben een verborgen relatie met elkaar?"
    3. De Chef neemt de antwoorden van beiden, legt ze naast elkaar en zegt: "Ah, nu zie ik het patroon!"

Dit samenwerken voorkomt dat de AI iets verzonnen. Als de Boekhouder zegt "Er is geen cijfer" en de Ontdekkingsreiziger zegt "Er is een verbinding", dan weet de Chef dat hij beide kanten moet bekijken.

3. De Magische Transformatie: Van Lijst naar Netwerk

Een van de coolste dingen die dit systeem doet, is het automatisch omzetten van saaie Excel-lijsten in een levendig netwerk.

  • Voorbeeld: Stel je hebt een lijst met projecten en namen.
  • De Boekhouder ziet alleen rijen en kolommen.
  • Het Systeem pakt die lijst en bouwt er een 3D-netwerk van. Plotseling ziet de computer niet meer alleen "Project A" en "Persoon B", maar ziet het een lijn tussen hen: "Persoon B werkt AAN Project A".
  • Dit maakt het mogelijk om vragen te stellen die verder gaan dan de lijst zelf, zoals: "Wie heeft gewerkt aan projecten die door dezelfde persoon zijn geleid?" Zonder dit netwerk zou de AI dit nooit kunnen vinden.

4. Waarom is dit zo goed? (De Resultaten)

De auteurs hebben dit getest op verschillende moeilijke vragen. Het resultaat?

  • Minder fouten: Omdat ze niet alles in één keer proberen te onthouden, verzinnen ze veel minder onzin.
  • Beter redeneren: Ze kunnen complexe vragen oplossen die meerdere stappen nodig hebben (bijv. eerst A vinden, dan B, en dan zien hoe A en B samenhangen).
  • Succes: In tests scoorde hun team 20% tot 24% beter dan de beste eerdere methoden. Het is alsof je van een fiets naar een snelle auto bent gegaan.

5. Het Gevaar van te veel overleg

Interessant genoeg ontdekten ze ook een valkuil. Als het team te vaak heen en weer praat (te veel overleg), wordt het antwoord juist slechter. Het is alsof als je te veel mensen in een vergadering roept, er niemand meer weet wat de oorspronkelijke vraag was.

  • De beste strategie: De Chef moet weten wanneer hij moet stoppen. Soms is één vraag aan de Boekhouder genoeg. Soms moet hij even overleggen met de Ontdekkingsreiziger. Maar als ze blijven praten zonder nieuwe informatie, wordt het antwoord onzeker.

Conclusie

DataFactory is geen enkele super-robot, maar een slim kantoor met een manager en gespecialiseerde afdelingen. Door de kracht van lijsten (rekenen) en netwerken (verbanden) te combineren, en door te laten praten in gewone menselijke taal in plaats van starre instructies, kunnen ze complexe vragen over data beantwoorden die voor andere systemen te moeilijk waren.

Het is een stap in de richting van AI die niet alleen slim is, maar ook samenwerkt zoals wij mensen dat doen: door elkaars sterke punten te gebruiken.