WebExpert: domain-aware web agents with critic-guided expert experience for high-precision search

本文提出了 WebExpert,一种通过句子级经验检索、基于弱监督的 Schema 轻量级特征归纳以及偏好优化规划来增强领域感知能力,从而在金融、生物医学等专业领域显著提升搜索精度并减少页面跳转的 Web 智能体。

Yuelin Hu, Zhengxue Cheng, Ronghua Wu, Qunshan Gu, Hongwei Hu, Wei Liu, Qiao Liang, Li Song

发布于 2026-04-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 WebExpert 的新系统。简单来说,它是一个**“懂行”的互联网搜索助手**,专门用来解决那些普通搜索引擎搞不定的专业难题(比如金融投资、生物医药、制药等)。

为了让你更容易理解,我们可以把普通搜索助手和 WebExpert 比作两种不同的“侦探”:

1. 普通搜索助手 vs. WebExpert:菜鸟侦探 vs. 老刑警

  • 普通搜索助手(Generic Agent):
    想象成一个刚入职的菜鸟侦探。接到一个案子(用户提问),他虽然很努力,但不懂行规。

    • 问题: 他可能会问一些太宽泛的问题(比如“怎么治感冒?”而不是“上海地区流感高发期的儿童用药禁忌”),导致搜出一堆无关的网页。他在网上乱逛,浪费了很多时间(页面跳转多),最后找到的证据也是模棱两可的,甚至被噪音误导。
    • 结果: 在专业领域(如金融、医疗),他很容易“跑偏”,答非所问。
  • WebExpert(我们的主角):
    这是一个经验丰富的老刑警,而且他随身带着一个**“专家经验手册”**。

    • 核心优势: 在开始搜索之前,他先翻阅“手册”,里面记录了过去专家处理类似案件总结出的**“行规”和“潜台词”**。
    • 例子: 如果用户问“某股票怎么样?”,普通助手可能直接搜新闻。但 WebExpert 会先调取经验手册,知道在金融领域,必须考虑“时间跨度”、“地区政策”和“行业细分”。于是他会立刻生成更精准的问题:“该股票在2023 年 Q4中国华东地区、受最新环保政策影响下的表现如何?”

2. WebExpert 是怎么工作的?(三步走策略)

这个系统就像是一个经过严格训练的专家团队,分三步走:

第一步:建立“专家经验库”(离线准备)

  • 做法: 研究人员收集了大量的专家问答、行业报告,让 AI 像做阅读理解一样,把里面最有价值的“句子”提取出来。
  • 比喻: 就像把几千本厚厚的法律条文和案例,提炼成几百条“办案口诀”
    • 比如把“不同资产相关性越低,分散风险效果越好”这样的废话少说,提炼成核心规则。
    • 系统会自动把这些规则分类(时间、地区、政策、行业),形成一个结构化的“行规字典”

第二步:智能“查字典”与“定计划”(推理过程)

  • 做法: 当用户提问时,WebExpert 不会直接去搜,而是先查“经验库”。
  • 比喻: 就像侦探在出发前,先问老前辈:“这种案子通常要注意什么?”
    • 经验门控(Experience Gate): 如果查到的经验很靠谱,他就严格按照经验里的“行规”去设计搜索词;如果经验库没找到靠谱信息,他就自动切换回“普通模式”,避免被错误的经验带偏。
    • 结果: 他生成的搜索词(Query)非常精准,直接命中要害,不再浪费时间去点那些无关的网页。

第三步:深度搜索与优化(训练过程)

  • 做法: 系统通过不断的“实战演练”(微调训练),学会如何更好地利用这些经验。
  • 比喻: 就像给侦探安排**“模拟法庭”**。如果侦探按照经验找到了正确答案,就奖励他;如果搜偏了,就批评他。久而久之,他不仅学会了用经验,还学会了如何把经验用得恰到好处。

3. 效果怎么样?(实战成绩)

论文在几个高难度的测试(GAIA, GPQA 等)中进行了对比,结果非常亮眼:

  • 更准: 答案的准确率(Exact Match)比目前最强的普通搜索助手提高了 1.5% 到 3.6%。在专业领域,这 1% 的提升往往意味着巨大的价值。
  • 更快: 因为搜索词更精准,它不需要像普通助手那样在网页间跳转很多次(Page Hops 减少),效率更高
  • 更稳: 即使面对复杂的、需要多步推理的问题,它也能保持逻辑清晰,不容易被噪音干扰。

4. 总结:为什么这很重要?

以前的 AI 搜索助手就像是一个博闻强记但缺乏常识的学生,什么都能搜,但不懂“行话”。

WebExpert 则像是一个带着“行业导师”的实习生。它通过**“批判性提取专家经验”(Critic-Guided Extraction),把专家脑子里的隐性知识变成了显性的规则,让 AI 在搜索时能“有的放矢”**。

一句话总结:
WebExpert 就是给 AI 装上了一本**“行业红宝书”**,让它不再是盲目地在网上大海捞针,而是像真正的专家一样,带着问题、带着规则去精准地寻找答案。这对于金融、医疗等对准确性要求极高的领域来说,是一个巨大的进步。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →