HELIOS: Harmonizing Early Fusion, Late Fusion, and LLM Reasoning for Multi-Granular Table-Text Retrieval

本文提出了 HELIOS 模型,通过结合基于边的二分图检索、查询相关节点扩展以及基于星图的 LLM 推理,有效克服了现有表格 - 文本检索方法在早期与晚期融合中的局限性,显著提升了开放域问答中的检索性能与复杂推理能力。

Sungho Park, Joohyung Yun, Jongwuk Lee, Wook-Shin Han

发布于 2026-03-04
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 HELIOS 的新系统,它的任务是帮助计算机在回答复杂问题时,能同时从表格(像 Excel 那样的数据)和文章(像维基百科那样的文字)中找到最准确的答案。

想象一下,你正在玩一个超级难的“寻宝游戏”。宝藏(答案)可能藏在一张复杂的表格数据里,也可能藏在一段长长的故事里,甚至需要你把表格里的数字和文章里的故事拼凑起来才能找到。

以前的寻宝方法主要有两种,但都有缺点:

  1. 早融合(Early Fusion):就像在出发前,先把所有可能相关的线索强行捆在一起打包。
    • 缺点:包里塞了太多垃圾(不相关的信息),而且如果线索之间没有明显的“名字”联系,它就把它们分开了,导致找不到那些需要动脑筋才能连起来的线索。
  2. 晚融合(Late Fusion):就像先单独找每一张线索卡片,然后再试图把它们拼起来。
    • 缺点:容易漏掉重要的背景信息,或者因为线索太多太杂,把错误的线索当成了正确的。

HELIOS 是怎么做的?
HELIOS 就像是一个拥有超级大脑的侦探,它把上述两种方法结合了起来,分三步走:

第一步:像“连点成线”一样精准搜索(边级检索)

以前的方法要么找整块(容易带垃圾),要么找单点(容易漏背景)。
HELIOS 发明了一种叫“边(Edge)”的概念。想象表格和文章是地图上的两个点,HELIOS 不找整块地图,也不只找孤立的点,而是专门找连接点和点的“线”

  • 比喻:如果表格是“球员名单”,文章是“球员简介”。以前的方法要么把整张名单和所有简介都塞给你(太乱),要么只给你看名字。HELIOS 直接给你看“名字”和“简介”之间那条特定的连线。这样既不会漏掉背景,也不会被无关信息干扰。

第二步:像“顺藤摸瓜”一样动态扩展(节点扩展)

找到几条关键的线后,HELIOS 不会停步。它会问:“这条线通向哪里?那里还有没有更重要的线索?”

  • 比喻:你找到了“球员 A"的简介,HELIOS 会立刻顺着线索去查“球员 A 所在的球队”、“球队的主教练”等。它像一个聪明的侦探,根据你问的问题(Query),动态地扩大搜索范围,把那些藏在深处的、原本没被注意到的关键信息(比如球队的颜色、教练的生日)都挖出来。

第三步:像“大律师”一样逻辑推理(基于星图的 LLM 推理)

这是 HELIOS 最厉害的地方。前面的步骤找出了很多线索,但有些问题需要逻辑推理,比如“谁是最年轻的?”或者“把某几列加起来是多少?”。普通的搜索引擎只会找关键词,不懂逻辑。
HELIOS 把找到的线索整理成一个个小的“星形图”(一个中心点连着几个周边点),然后交给一个大语言模型(LLM),就像请了一位大律师来审案。

  • 比喻
    • 场景:问题是“谁在 2012 年选秀中被第 27 顺位选中?他的学校校色是什么?”
    • 普通搜索:可能只找到“第 27 顺位”和“学校名字”,但找不到校色,因为校色在另一段文字里,和表格没有直接关键词联系。
    • HELIOS 的律师:它会看表格,发现第 27 顺位是"Brendan King",学校是"Notre Dame"。然后它立刻去检查关于"Notre Dame"的文章,发现文章里写着“校色是金色和蓝色”。它能把表格里的数字逻辑和文章里的描述逻辑完美结合起来,给出正确答案。

总结:HELIOS 为什么强?

  • 不盲目:它不像以前的方法那样要么太粗(带垃圾),要么太细(漏背景),而是刚刚好(边级检索)。
  • 会思考:它不只是找关键词,还能像人一样进行多步推理(比如先查 A,再根据 A 查 B,最后得出结论)。
  • 结果好:在测试中,HELIOS 的表现比目前最顶尖的系统强了40% 以上

一句话概括:
HELIOS 就像一个既懂数据又懂故事,还能像侦探一样顺藤摸瓜、像律师一样逻辑推理的超级助手,它能把表格和文字完美融合,帮你找到那些最难找的答案。