TURA: Tool-Augmented Unified Retrieval Agent for AI Search

本文提出了 TURA(工具增强的统一检索代理),这是一种结合检索增强生成(RAG)与智能体工具调用的三阶段框架,通过意图感知检索、基于 DAG 的任务规划及轻量级执行器,有效解决了传统 RAG 在处理实时动态数据(如库存和票务)方面的局限,实现了面向大规模工业级 AI 搜索产品的静态内容与动态信息源的统一检索。

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei Yin

发布于 Fri, 13 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 TURA 的新系统,它是百度开发的一种“超级智能搜索助手”。

为了让你轻松理解,我们可以把传统的搜索引擎和 TURA 比作两种不同的旅行规划师

1. 传统搜索的困境:只会查“旧地图”的规划师

想象一下,你以前用的搜索引擎(比如传统的 RAG 技术)就像是一个只读过图书馆里所有旧书的规划师。

  • 它的强项:如果你问“北京故宫的历史是什么?”或者“上海有哪些著名景点?”,它能从书里(静态网页)迅速找到答案,非常准确。
  • 它的弱点:如果你问“帮我买一张明天从北京到上海的高铁票,要二等座”,它就傻眼了。
    • 为什么?因为书里没写明天的票剩多少,也没法直接帮你点“购买”按钮。
    • 它只能给你一堆过期的网页链接,告诉你“以前有人这么买过”,但无法处理实时数据(如余票、价格变动)或执行操作(如订票)。

这就好比你想去旅行,它只能给你看一本几年前的旅游指南,却没法帮你订当下的机票。

2. TURA 的解决方案:拥有“超能力”的全能管家

TURA 的出现,就是为了解决这个问题。它不再只是一个“读书人”,而是一个拥有超能力的“全能管家”。它不仅能查资料,还能直接动手办事

TURA 的工作流程分为三个神奇的步骤,我们可以用**“点外卖”**来打比方:

第一步:意图感知与工具检索(“听清需求,找对帮手”)

当你说:“我要去北京玩,需要查天气、订酒店、找景点。”

  • 传统做法:可能会把这句话当成一个整体去搜,结果搜出一堆杂乱的信息。
  • TURA 的做法:它像一个经验丰富的管家,立刻把你的大需求拆解成几个小任务:
    1. 查北京天气。
    2. 找附近的酒店。
    3. 推荐景点。
    4. 规划路线。
      然后,它迅速在它的“工具库”里(就像手机里的各种 APP)找到对应的“专家”:天气 APP、酒店预订 API、地图 API。它知道该叫谁来帮忙。

第二步:DAG 任务规划(“并行处理,拒绝排队”)

这是 TURA 最聪明的地方。

  • 传统做法:像是一个笨拙的办事员,做完一件事再做下一件。先查天气,等结果回来;再查酒店,等结果回来……效率很低,你等得很着急。
  • TURA 的做法:它画了一张**“任务关系图”**(DAG)。
    • 它发现:“查天气”和“找酒店”互不干扰,可以同时进行!
    • 只有“规划路线”需要等“酒店”和“景点”的结果出来后才能做。
    • 于是,它像指挥交通一样,让能同时做的任务并行爆发,大大缩短了等待时间。这就好比你去餐厅,服务员不是等你点完菜再一个个去厨房,而是后厨同时开始准备凉菜和热菜。

第三步:蒸馏代理执行(“训练出“快手”小徒弟”)

这里有一个很酷的技术细节。

  • 问题:让一个超级聪明但反应慢的大老板(超大模型)去干具体的活(比如调用 API 订票),成本太高,速度太慢,用户等不起。
  • TURA 的做法:它请大老板(老师模型)先演示一遍怎么高效地订票、查天气,然后把这些经验**“蒸馏”(像提炼精华一样)教给一个反应极快的小徒弟**(小模型)。
    • 这个小徒弟虽然个头小,但它继承了大老板的“肌肉记忆”和“直觉”。
    • 在真正干活时,小徒弟不需要像大老板那样慢慢思考“为什么”,而是直接凭直觉给出最正确的操作指令。
    • 结果:既保留了高智商(准确率高),又拥有了飞一般的速度(低延迟)。

3. 实际效果:从“看书”到“办事”的跨越

论文中展示了一个真实的例子:

  • 用户问:“帮我买一张 2025 年 8 月 2 日从北京到上海的高铁票。”
  • 传统搜索:只能给你一堆关于高铁的旧新闻,告诉你“通常有票”,但没法告诉你那天具体哪趟车还有票,更没法帮你买。
  • TURA
    1. 识别出这是“订票”需求。
    2. 直接调用携程(Ctrip)的实时接口。
    3. 告诉你:"G1 次列车还有二等座,票价 669 元,是否确认?”
    4. 甚至可以直接帮你完成预订动作。

总结

TURA 的核心贡献就是打破了“搜索只能查静态资料”的魔咒。

它把 AI 搜索从一个**“只会读书的图书管理员”,升级成了一个“既能查资料、又能打电话、还能直接帮你办事的超级管家”**。

  • 以前:你问它,它给你一堆链接,你自己去点、去填、去等。
  • 现在:你告诉它要什么,它直接调用各种工具(天气、地图、订票、股票等),在几秒钟内把最终结果(甚至直接完成交易)交给你。

这项技术已经在百度搜索中上线,服务了数千万用户,让 AI 真正从“聊天”走向了“干活”。