Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

本論文は、多様なエージェントデータ形式を統一する軽量な「エージェントデータプロトコル(ADP)」を提案し、13 のデータセットを統合して大規模ファインチューニングを行うことで、ドメイン固有の調整なしに標準ベンチマークで最先端またはそれに準ずる性能を達成したことを示しています。

Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

🤖 エージェントデータプロトコル(ADP):AI 助手を育てるための「共通言語」の誕生

この論文は、**「AI エージェント(人間のように行動する AI)」をより賢く育てるための、画期的な「共通のルール」**を紹介するものです。

まるで、世界中の異なる国から集まった子供たちを、同じ学校で勉強させるために「共通言語」を決めたような話です。


🌍 背景:バラバラな「教育資料」の悩み

以前から、AI に「ウェブを閲覧する」「コードを書く」「ツールを使う」といった複雑な仕事を教えるデータ(トレーニングデータ)はたくさんありました。

しかし、問題は**「データの形式がバラバラ」**だったことです。

  • A 社のデータは「日本語の日記」形式。
  • B 社のデータは「英語の Excel」形式。
  • C 社のデータは「特殊なプログラミング言語」形式。

これでは、AI を育てる先生(研究者)は、**「A 社のデータなら A 社の教科書、B 社のデータなら B 社の教科書」**と、データごとに専用の変換作業をしなければなりません。
「100 種類のデータがあれば、100 種類の教科書を作る必要があり、とても大変だ!」というのが現状でした。そのため、せっかくの素晴らしいデータがあっても、AI 教育に活かせていないケースが多かったのです。

💡 解決策:「エージェントデータプロトコル(ADP)」という「共通言語」

この論文の著者たちは、**「ADP(Agent Data Protocol)」**という新しい「共通言語」を作りました。

🏗️ 比喩:レゴブロックの「標準化」

想像してみてください。

  • ADP がない世界: 赤いブロック、青いブロック、黄色いブロックが、それぞれ「A 社製」「B 社製」で形が微妙に違います。これらを組み合わせて大きな城(AI)を作るには、一つ一つ手作業で形を整える必要があります。
  • ADP がある世界: すべてのブロックを**「標準的なレゴブロック」**に変換するルールを決めました。
    • 赤いブロックも、青いブロックも、黄色いブロックも、すべて「標準レゴ」に変換されます。
    • すると、「標準レゴ」さえあれば、どんな城(AI)も簡単に作れるようになります。

ADP は、**「行動(Action)」「観察(Observation)」**という 2 つの基本的な要素にデータを分解し、それを統一された形(Pydantic という形式)で表現するルールです。

🔄 ADP がどう働くか?(3 ステップ)

  1. 変換(Raw → ADP):
    世界中のバラバラなデータ(SWE-Gym や Mind2Web など 13 種類)を、ADP という「標準レゴ」に変換します。これは**「1 回だけ」**行えば OK です。
  2. 統一(ADP → SFT):
    変換された「標準レゴ」を、特定の AI 先生(OpenHands や SWE-Agent など)が読みやすい形にします。これも**「1 回だけ」**行えば OK です。
  3. 学習:
    準備されたデータで AI をトレーニングします。

✨ すごいところ:
以前は「データ数 × AI の種類」の作業が必要でしたが、ADP を使えば「データ数 + AI の種類」の作業で済みます。まるで、**「100 人の生徒に 100 種類の教科書を配る」のではなく、「1 冊の教科書を配るだけで、100 人の先生がそれぞれ授業ができる」**ようになったようなものです。

📈 実験結果:驚異的な成果

著者たちは、この ADP を使って 13 種類のデータをまとめ、130 万もの学習データ(ADP Dataset V1)を作成しました。そして、これを AI に学習させたところ、以下のような素晴らしい結果が出ました。

  • 平均 20% 以上の性能向上: 元々の AI よりも、はるかに賢くなりました。
  • トップクラスの成績: コーディング、ウェブ閲覧、ツール操作などのテストで、世界最高レベル(SOTA)の成績を叩き出しました。
  • 専門特化なしでも強い: 「コーディング用 AI」や「検索用 AI」のように、特定の分野に特化して作らなくても、**「何でもできる万能 AI」**として活躍できました。

🚀 今後の展望:コミュニティの成長

この論文は、単に「すごい AI」を作っただけではなく、**「誰でも簡単に AI を育てられる土台」**を作った点に大きな意義があります。

  • オープンソース化: すべてのコードとデータは公開されています。
  • 誰でも参加可能: 新しいデータが出たら、ADP に変換するだけで、すぐに世界中の AI 教育に貢献できます。

🎯 まとめ

この論文は、「AI エージェントの教育」を、バラバラな個人作業から、効率的でスケール可能な「共通のプロジェクト」へと変えたという画期的な成果です。

ADP は、AI 開発者にとっての**「共通の言語」**となり、これからの AI 時代において、より賢く、多様なことができる AI 助手が、爆発的に増えるきっかけを作ってくれるでしょう。

一言で言うと:
「バラバラな言語で話していた AI の先生たちを、ADP という『共通言語』で繋ぎ合わせ、全員が協力して最強の AI 助手を育てることに成功しました!」