HELIOS: Harmonizing Early Fusion, Late Fusion, and LLM Reasoning for Multi-Granular Table-Text Retrieval

Het artikel introduceert HELIOS, een nieuw model dat vroege en late fusie combineert met LLM-redenering om de prestaties van tabel-tekstretriever voor open-domein vragen te verbeteren door onnodige context te filteren, relevante knopen dynamisch uit te breiden en logische inferentie op ster-graf-niveau uit te voeren, wat leidt tot aanzienlijke verbeteringen op de OTT-QA-benchmark.

Sungho Park, Joohyung Yun, Jongwuk Lee, Wook-Shin Han

Gepubliceerd 2026-03-04
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Helius: De Slimme Zoekmachine die Tabellen en Tekst Samenbrengt

Stel je voor dat je op zoek bent naar een specifiek antwoord, maar de informatie is verspreid over twee heel verschillende bibliotheken. In de ene bibliotheek staan tabellen: strakke rijen en kolommen met feiten, zoals een sportuitslaglijst of een rooster. In de andere bibliotheek liggen boeken: lange, lopende teksten die de achtergrondverhalen vertellen.

De uitdaging? Een traditionele zoekmachine is vaak slecht in het combineren van deze twee. Of hij kijkt alleen naar de tabellen en mist de context, of hij leest alleen de boeken en ziet de precieze cijfers in de tabel niet.

De onderzoekers van dit paper hebben HELIOS bedacht. De naam is een knipoog naar de Griekse zonnegod, maar in dit geval staat het voor een systeem dat de zonneschijn (helderheid) brengt in een chaotische zoektocht. HELIOS werkt in drie stappen, die we kunnen vergelijken met het werk van een super-efficiënte detective.

Stap 1: De "Vaste Vrienden" (Early Fusion)

Stel je voor dat je een detective bent die eerst een lijst maakt van mensen die waarschijnlijk bij elkaar horen.

  • Hoe het werkt: HELIOS kijkt eerst naar de tabellen en koppelt daar direct de bijbehorende teksten aan. Bijvoorbeeld: als er in een tabel "University of Notre Dame" staat, plakt hij direct het artikel over die universiteit eraan.
  • Het probleem: Soms plakt hij te veel eraan. Hij plakt misschien ook het artikel over de voetbalclub van die universiteit eraan, terwijl jij alleen de schoolkleuren wilt weten. Hij is te breed en plakt soms onnodige rommel aan zijn dossier.

Stap 2: De "Slimme Uitbreiding" (Late Fusion)

Nu komt de detective met een tweede strategie. In plaats van vooraf alles te plakken, kijkt hij eerst naar je vraag.

  • Hoe het werkt: Als jij vraagt: "Wat zijn de schoolkleuren?", zoekt HELIOS eerst naar de specifieke regel in de tabel die over de school gaat. Vervolgens kijkt hij: "Welk artikel hoort nu precies bij deze vraag?" en plakt alleen dat artikel eraan.
  • Het probleem: Soms mist hij een belangrijk stukje informatie omdat hij te specifiek zoekt. Hij ziet misschien niet dat je een logische sprong moet maken (bijvoorbeeld: "De speler speelde in 2012, dus ik moet de tabel van dat jaar bekijken, niet de huidige").

Stap 3: De "Super-Detective" (LLM Reasoning)

Hier komt HELIOS echt tot leven. Hij combineert de twee bovenstaande methoden en voegt een Super-Detective (een AI) toe die het dossier in detail bekijkt.

  • De Magie: De AI kijkt niet alleen naar woorden die lijken op je vraag. Hij denkt na.
    • Voorbeeld 1 (Aggregatie): Als je vraagt: "Wie was de meest recente speler van de maand?", telt de AI niet zomaar. Hij kijkt naar de rijen, ziet welke maand het laatst is (november in plaats van april), en pakt die specifieke rij.
    • Voorbeeld 2 (Meerdere stappen): Als je vraagt: "Waar is de speler geboren die in 2012 werd gekozen?", zoekt de AI eerst de speler in de tabel, en springt dan logisch naar het artikel over die speler om de geboortedatum te vinden.

Waarom is HELIOS zo goed?

De onderzoekers hebben getoond dat HELIOS veel beter presteert dan de huidige beste systemen.

  • Geen rommel: Hij plakt niet zomaar alles aan elkaar, maar zoekt de juiste stukjes (de "randen" tussen tabel en tekst).
  • Geen gemiste kansen: Hij breidt zijn zoektocht slim uit als hij ziet dat hij iets mist.
  • Logisch denken: Hij kan complexe vragen beantwoorden die vragen om rekenen of het verbinden van verschillende feiten, iets waar andere systemen vaak op vastlopen.

Kortom:
HELIOS is als een detective die niet alleen een lijst met namen heeft, maar ook weet welke boeken hij moet lezen, en bovendien slim genoeg is om de puzzelstukjes logisch aan elkaar te rijgen. Het resultaat is dat hij veel sneller en nauwkeuriger het juiste antwoord vindt, zelfs als de vraag heel lastig is.