AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents

AgentSynth は、情報非対称性を利用したスケーラブルかつ低コストなパイプラインにより、一般化されたコンピュータ操作エージェント向けの高品質なタスクと軌跡データを自動生成し、その複雑さを精密に制御しながら 6,000 以上の多様なタスクを構築する手法を提案しています。

Jingxu Xie, Dylan Xu, Xuandong Zhao, Dawn Song

公開日 2026-03-03
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文「AgentSynth」は、**「AI にパソコン操作を教えるための、安くて大量の練習問題を作る工場」**について書かれたものです。

専門用語を抜きにして、わかりやすい例え話で説明しますね。

🏭 1. 問題:AI の練習問題は「手作業」でしか作れなかった

これまで、パソコンを操作する AI(エージェント)を勉強させるためには、人間が一つ一つ「まずはマウスをここをクリックして、次にこの文字を入力して…」という手順を実際にやって、それをデータとして残す必要がありました。

  • 昔のやり方: 人間が手作業で練習問題を作る。
  • デメリット: 時間がかかる、お金がかかる、そして「できること」が限られてしまう(人間が思いつかない複雑な作業は作れない)。

🧩 2. 解決策:AgentSynth(エージェント・シンセス)の仕組み

この論文では、**「情報を非対称(ひじょう)に使う」**というアイデアで、AI 自身が練習問題と正解の答え(軌跡)を自動で作るシステム「AgentSynth」を開発しました。

🍪 例え話:「巨大なケーキ」の作り方

このシステムの核心は、**「巨大で複雑なケーキ(難易度の高いタスク)を、一度に作ろうとせず、小さなクッキー(簡単なサブタスク)を積み重ねて作る」**という考え方です。

  1. 小さなクッキーを作る(サブタスク生成):
    まず、AI に「マウスを動かして『保存』ボタンを押す」といった、人間でも一瞬でできる簡単な作業をさせます。これは AI にとって簡単なので、失敗せずに正しく実行できます。
  2. クッキーを積み重ねる(連鎖):
    その作業が終わったら、「次は『ファイル名』を入力して」という次の簡単な作業を AI に考えさせます。これを 5 回、10 回と繰り返します。
  3. 巨大なケーキに仕上げる(要約):
    最後に、AI に「さっきの 10 個のクッキーの作業を全部まとめて、一つの大きな物語(タスク)にしてください」と言います。
    • 結果: 「保存ボタンを押して、ファイル名を入力して、フォルダを選んで…」という、一見すると非常に長く複雑で難しいタスクが完成します。

🎭 なぜこれがすごいのか?(情報の非対称性)

ここが最大のポイントです。

  • 作っている AI にとって: 「クッキーを 1 個ずつ作るのは簡単」なので、正解の答え(軌跡)を確実に作れます。
  • テストを受ける AI にとって: 「クッキー 10 個分を一度に考えて、複雑な手順を間違えずにこなすのは超難しい」です。

つまり、**「作り手には簡単だが、解き手には難しい」**という、ちょうどいい難易度の練習問題が、自動で大量に作れるのです。

📊 3. 結果:AI はまだ「初心者」レベル

このシステムを使って 6,000 以上の練習問題を作り、最新の AI にテストさせました。

  • 簡単な問題(レベル 1): 18% くらいは成功。
  • 難しい問題(レベル 6): 4% しか成功しない。

これは、**「現在の AI は、複雑なパソコン操作はまだ苦手」**ということを証明しました。人間は 70% 成功するのに対し、AI はまだ未熟です。このシステムは、AI の限界を測るための「優秀なテスト」になっています。

💰 4. 驚きの安さ

  • 人間が作る場合: 1 つのタスクを作るのに数千円〜数万円かかることもあります。
  • AgentSynth の場合: 1 つのタスク(とそれに関連するデータ)を作るのに、**たったの 60 円(約 0.6 ドル)**で済みます。

これは、**「人間が 1 時間かけて作る仕事を、AI が 1 秒で 60 円でやってくれる」**ようなもので、これなら何万個でも練習問題を作れます。

🎯 まとめ

この論文は、**「AI にパソコン操作を教えるための、安くて質の高い練習問題工場」**を作りました。

  • 工夫: 難しいことを一度に作らず、簡単なステップを積み重ねて作る。
  • 効果: 1 個 60 円で、6,000 個以上の「AI が苦戦するレベル」の問題が作れた。
  • 意味: これにより、AI が本当に賢いのか、どこが苦手なのかを正確に測れるようになり、今後の AI 開発が加速するでしょう。

まるで、**「子供に複雑な料理を教えるために、まずは「卵を割る」練習をさせ、次に「炒める」練習をさせ、最後に「全体を組み合わせた料理」をテストする」**ような、とても賢い教育方法なのです。