HELIOS: Harmonizing Early Fusion, Late Fusion, and LLM Reasoning for Multi-Granular Table-Text Retrieval

Das Paper stellt HELIOS vor, ein System, das die Stärken von früher und später Fusion mit LLM-Reasoning kombiniert, um durch subgraphbasierte Retrieval- und Verfeinerungstechniken die Genauigkeit bei der mehrgranularen Tabellen-Text-Retrieval für offene Fragen signifikant zu verbessern.

Sungho Park, Joohyung Yun, Jongwuk Lee, Wook-Shin Han

Veröffentlicht 2026-03-04
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du bist ein Detektiv, der eine komplexe Frage beantworten muss. Deine Beweise liegen in zwei völlig verschiedenen Welten:

  1. Die Tabellen-Welt: Hier gibt es strenge Listen, Zahlen und Fakten (wie eine Sporttabelle mit Spielern, Teams und Daten).
  2. Die Text-Welt: Hier gibt es lange, erzählerische Artikel (wie eine Biografie über einen Spieler oder eine Geschichte über ein Team).

Das Problem: Wenn du eine Frage stellst wie "Welche Schulfarben hat die Universität, die der Spieler aus dem 27. Pick des Drafts besucht hat?", müssen diese beiden Welten zusammenarbeiten. Bisherige Methoden waren dabei oft wie blinde Detektive.

Hier ist die Geschichte von HELIOS, dem neuen Super-Detektiv, der das Problem löst.

Das alte Problem: Die zwei falschen Wege

Früher gab es zwei Hauptmethoden, um Beweise zu sammeln, und beide hatten ihre Macken:

  • Der "Frühe-Verstärker" (Early Fusion): Dieser Detektiv klebt alles, was er denkt, könnte relevant sein, sofort zusammen. Er nimmt eine Tabellenzeile und klebt sie mit allen umliegenden Texten zusammen, wie einen riesigen Klecks.
    • Das Problem: Er bringt viel "Müll" mit. Er klebt auch Texte an, die nichts mit deiner Frage zu tun haben. Das verwirrt ihn, wie wenn man einem Detektiv 100 Fotos zeigt, aber nur eines das Gesuchte ist.
  • Der "Späte-Verstärker" (Late Fusion): Dieser Detektiv sucht erst nach einzelnen Wörtern. Er sucht nach "Notre Dame" in der Tabelle und dann nach "Notre Dame" im Text.
    • Das Problem: Er verpasst oft den Kontext. Er findet vielleicht das Wort, aber nicht die Beziehung. Er sieht den Spieler, aber nicht, dass er zur Universität gehört, die die Frage eigentlich meint.

Beide Methoden scheiterten auch bei schwierigen Rätseln, bei denen man logisch denken muss (z. B. "Wer war der jüngste Spieler?" oder "Addiere alle Punkte dieser Spalte").

Die HELIOS-Lösung: Der Meister-Detektiv

HELIOS kombiniert die Stärken aller Welten in einem cleveren, dreistufigen Prozess. Stell dir das wie eine perfekte Ermittlungsmannschaft vor:

Schritt 1: Das feine Sieb (Edge-based Retrieval)

Statt ganze Kleckse (Tabellen + Text) zu nehmen, schaut HELIOS auf die Verbindungen (die "Kanten") zwischen den einzelnen Zeilen und Texten.

  • Die Analogie: Stell dir vor, du hast ein riesiges Netz aus Fäden. Frühere Methoden haben ganze Bündel Fäden geschnitten. HELIOS schneidet nur die einzelnen Fäden heraus, die wirklich relevant sind. So vermeidet er den "Müll" (irrelevante Texte) und behält die feinen Details.

Schritt 2: Das Wachstum des Baumes (Query-relevant Node Expansion)

Jetzt hat HELIOS ein paar gute Fäden. Aber reicht das? Vielleicht fehlt noch ein wichtiger Ast.

  • Die Analogie: HELIOS nimmt die besten Fäden, die er gefunden hat, und fragt: "Wenn ich hier weitergehe, was finde ich noch?" Er wächst seinen Beweis-Baum dynamisch. Er sucht gezielt nach den nächsten Beweisen, die genau zu deiner Frage passen, und fügt sie hinzu. So verpasst er keine wichtigen Details, die im ersten Schritt übersehen wurden.

Schritt 3: Der große Denker (Star-based LLM Refinement)

Jetzt hat HELIOS einen Haufen Beweise. Aber manchmal muss man logisch schliessen, nicht nur suchen.

  • Die Analogie: Stell dir vor, HELIOS legt seine Beweise vor einen Super-Intelligenz-Rat (ein großes KI-Modell, das wir LLM nennen). Aber er gibt dem Rat nicht den ganzen Haufen Papier auf einmal (das würde verwirren). Stattdessen gibt er ihm kleine, übersichtliche "Stern-Gruppen" (eine Tabellenzeile + ihre direkten Texte).
  • Der Super-Rat denkt jetzt nach: "Ah, die Tabelle zeigt den Monat November 2009. Das ist der neueste Eintrag! Also ist dieser Spieler der gesuchte." Oder: "Die Tabelle sagt 'Gold und Blau', aber der Text bestätigt es."
  • Der Rat filtert den Müll heraus und löst die logischen Rätsel, die reine Suchmaschinen nicht können.

Das Ergebnis: Warum HELOS gewinnt

Durch diese Kombination aus feinem Suchen, intelligentem Wachstum und logischem Denken ist HELIOS unschlagbar.

  • Er ist präziser: Er findet die richtigen Beweise viel öfter als die alten Methoden (bis zu 42% besser!).
  • Er ist schlauer: Er kann komplexe Fragen beantworten, bei denen man addieren oder vergleichen muss.
  • Er ist effizient: Er verschwendet keine Zeit mit irrelevanten Informationen.

Zusammenfassend:
Während alte Methoden entweder zu grob (alles zusammenwerfen) oder zu blind (nur nach Wörtern suchen) waren, ist HELIOS wie ein Meister-Detektiv mit einem perfekten Assistenten. Er sucht gezielt nach den richtigen Fäden, baut sein Beweismaterial intelligent aus und lässt am Ende einen klugen Kopf die logischen Schlüsse ziehen. So wird aus einem chaotischen Haufen von Tabellen und Texten eine klare, korrekte Antwort.