Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

该论文提出了轻量级的“代理数据协议”(ADP),作为一种统一不同来源异构数据的中间语言,成功整合了 13 个现有数据集进行监督微调,使大语言模型代理在无需领域特定调整的情况下,在代码、浏览及工具使用等基准测试中实现了约 20% 的性能提升并达到或接近最先进水平。

Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 ADP (Agent Data Protocol,智能体数据协议) 的新工具。为了让你轻松理解,我们可以把大语言模型(LLM)训练成“智能体”(能像人一样操作电脑、浏览网页、写代码的 AI)的过程,想象成培养一名全能超级管家

1. 核心问题:为什么培养“超级管家”这么难?

想象一下,你想培养一个能帮你做所有事的管家。

  • 你有一本菜谱(数据集 A),教他怎么做中餐,但格式是手写的,字迹潦草。
  • 你有一本维修手册(数据集 B),教他怎么修家电,但全是英文图表。
  • 你有一本旅游指南(数据集 C),教他怎么带路,但用的是录音带。

虽然这些资料里都有很多有用的知识,但因为格式太乱、语言不通、标准不一,你很难把它们混在一起教给管家。如果你想让他既会做饭又会修车,你就得花大量精力去把每本书都重新抄写一遍,翻译成同一种语言,再重新排版。这就是目前 AI 研究面临的困境:数据虽然多,但太分散,无法统一使用。

2. 解决方案:ADP 是什么?

ADP 就是那个“万能翻译官”和“标准化格式转换器”。

作者们设计了一种通用的“语言”(协议),不管原来的数据是菜谱、维修手册还是旅游指南,ADP 都能把它们瞬间转换成统一的标准格式

  • 原来的混乱状态

    • 数据 A:[动作:切菜,观察:菜切好了]
    • 数据 B:[点击按钮,网页显示:维修完成]
    • 数据 C:[输入代码,屏幕输出:错误]
    • (格式五花八门,AI 学起来很晕)
  • ADP 统一后的状态
    ADP 规定所有数据都变成两种核心元素:

    1. 动作 (Action):AI 做了什么?(比如:调用 API、写代码、说话)
    2. 观察 (Observation):环境反馈了什么?(比如:网页内容、代码运行结果、用户指令)

    不管原来是什么数据,经过 ADP 处理后,都变成了:

    • [动作:写代码,内容:print("Hello")]
    • [观察:环境反馈,内容:Hello World]

3. 这个协议带来了什么好处?

A. 像“乐高积木”一样灵活

以前,如果你想把“修车数据”教给一个“写代码的 AI",你需要专门写一个转换器,把修车数据变成代码 AI 能懂的样子。
有了 ADP,你只需要做两步:

  1. 第一步:把修车数据扔进 ADP,它自动变成标准积木(一次搞定)。
  2. 第二步:把标准积木扔给任何 AI 框架(写代码的、修电脑的、聊天的),它们都能直接吃进去。

比喻:以前是“每个国家都要自己修路才能通车”;现在是“大家都用国际标准集装箱”,不管卡车(AI 模型)是什么牌子的,只要装上集装箱(ADP 数据)就能跑。

B. 效果惊人:1+1 > 2

论文做了一个实验,把 13 个不同的数据集(有的教写代码,有的教上网,有的教用工具)全部用 ADP 统一后,混合在一起训练 AI。

  • 结果:AI 的能力大幅提升,平均提高了 20%
  • 神奇之处:这个 AI 没有专门针对某个领域(比如只学修车)进行微调,但它学会了举一反三。它既能在写代码任务中表现出色,也能在网页浏览任务中游刃有余。这说明,混合不同领域的知识,能让 AI 变得更聪明、更通用。

C. 省去了重复造轮子

如果没有 ADP,如果有 100 个数据集和 100 个 AI 框架,研究人员就需要写 $100 \times 100 = 10,000$ 个转换器。
有了 ADP,只需要写 $100 + 100 = 200$ 个转换器(100 个把数据转成标准,100 个把标准转给框架)。
比喻:以前是“每个人都要学 100 种方言才能和邻居聊天”;现在是“大家都学一种普通话”,沟通成本瞬间降低。

4. 总结

这篇论文的核心思想就是:不要为了数据格式发愁,我们要建立一套通用的“普通话”(ADP)。

  • 过去:数据像一堆散落在世界各地的方言,很难整合。
  • 现在:ADP 把它们都翻译成了“普通话”。
  • 未来:只要有了这套协议,研究人员可以轻松地混合各种数据,训练出更强大、更通用的 AI 智能体,而且所有人都能免费使用这些标准化的数据。

这就好比在 AI 的世界里,ADP 建立了一个通用的“数据高速公路”,让所有的知识都能顺畅地流动,最终让 AI 智能体真正变得像人类一样博学多才。