OSExpert: Computer-Use Agents Learning Professional Skills via Exploration

この論文は、GUI 深さ優先探索による環境機能の網羅的検証と、その結果を基にしたスキル構成による自己カリキュラム学習を導入することで、OSExpert-Eval ベンチマークにおいて性能を約 20% 向上させ、人間との効率性の格差を約 80% 縮小する専門的なコンピュータ使用エージェント「OSExpert」を提案しています。

Jiateng Liu, Zhenhailong Wang, Rushi Wang, Bingxuan Li, Jeonghwan Kim, Aditi Tiwari, Pengfei Yu, Denghui Zhang, Heng Ji

公開日 2026-03-10
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

OSExpert:パソコン操作の「プロ」を目指す AI の新しい学び方

この論文は、**「AI にパソコンを使わせる」**という課題に対する、画期的な新しいアプローチを紹介しています。

これまでの AI は、人間が「こうやって操作したよ」という大量の動画やデータを見て学習していました。しかし、新しい専門ソフトや、見たことのない画面デザインに出会うと、AI はすぐにパニックを起こして失敗してしまいます。まるで、**「寿司屋で修行した人が、いきなりイタリアンレストランでパスタを作ろうとして、フォークで麺を掴もうとする」**ような状態です。

この論文の著者たちは、AI を「プロの職人」にするために、**「AI 自身にパソコンを探索させて、スキルを自分で見つけてくる」**という方法(OSExpert)を開発しました。

以下に、この技術をわかりやすく説明します。


1. 問題:なぜ今の AI は「プロ」になれないのか?

現在の AI は、人間が教えた「一般的な操作」は得意ですが、**「複雑な仕事」「見たことのない画面」**には弱いです。

  • 失敗の連鎖: 最初のステップで少し間違えると、その後の操作もすべて狂ってしまいます。
  • 非効率: 正解が見つかるまで、何百回も「試行錯誤」を繰り返して、時間ばかりかかります。
  • 微細な操作が苦手: 「この文字の 3 文字だけ太字にする」「画像の輪郭をピタリと切り取る」といった、指先のような繊細な操作ができません。

これでは、現実世界の専門職(デザイナーや事務員など)の仕事を任せるのは危険です。

2. 解決策:AI による「自己探索(OSExpert)」

著者たちは、AI に「教科書」を渡すのではなく、「実験室(新しいパソコン環境)」に放り込んで、自分で探検させることにしました。

① 「迷路探検」アルゴリズム(GUI-DFS)

AI は、新しいソフト(例えば画像編集ソフトや表計算ソフト)を開くと、まず**「迷路探検」**を始めます。

  • メニューを全部開いてみる: 「ファイル」「編集」「表示」など、すべてのボタンを押して「何が起こるか」を確認します。
  • 失敗も記録する: 「このボタンは押すとエラーが出た」という失敗も、重要なデータとして記録します。
  • スキル帳を作る: 「このボタンを押すと、文字が太くなる」という**「単一のスキル」**を見つけると、それを「スキル帳」に書き留めます。

これを、ソフトの機能のすべてがなくなるまで繰り返します。まるで、**「新しい料理屋の厨房に入り込み、すべての調理器具の使い方を一つずつ試して、マニュアルを作ってしまう」**ようなイメージです。

② スキルの組み合わせ(コンポジション)

単一のスキル(例:「文字を太字にする」)が揃ったら、AI はそれを組み合わせて**「複雑なレシピ」**を作ります。

  • 「文字を太字にする」+「色を変える」+「画像を挿入する」=「見栄えの良いレポートを作る」
    このように、小さなスキルを積み重ねて、**「プロがやるような複雑な作業」**を自分で計画できるようになります。

③ 微細な操作の「魔法の道具」

「文字の一部分だけ選択する」といった、AI が苦手な細かい操作には、**「特別な道具(プリミティブ)」**を使います。

  • AI 自身は「マウスを動かす」のが苦手でも、**「輪郭を自動で切り取る AI」「テキストを正確に選択するツール」**といった、専門的な道具を呼び出して使います。
  • これを探索中に成功させれば、その「道具の使い方」もスキル帳に追加されます。

3. 結果:驚異的な進化

この方法で学習した AI は、以下の劇的な改善を見せました。

  • 成功率の向上: 複雑なタスクの成功率が、従来の AI の 10% 未満から30% 近くに上がりました(人間のプロに近づいています)。
  • 効率化: 失敗を繰り返して時間を浪費するのをやめ、「自分の限界(できないこと)」を事前に知っているため、無駄な作業を即座にやめます。これにより、人間のプロと比べて80% 近く効率化されました。
  • 未知の環境への適応: 見たことのない画面デザインでも、事前に「迷路探検」でスキルを蓄えているため、慌てずに操作できます。

4. 比喩でまとめると

  • 従来の AI: 料理本(データ)を丸暗記した料理人。新しい食材や調理器具が出ると、パニックになって焦げます。
  • OSExpert(この論文の AI): 料理本を持たず、「新しい厨房に入り込み、すべての道具を自分で触って試す」料理見習い。最初は失敗しますが、その過程で「包丁の正しい持ち方」「オーブンの温度設定」を自分の経験としてスキル帳にまとめます
    • 結果として、どんな厨房(新しいソフト)に入っても、その厨房のルールを把握した「プロの料理人」として活躍できます。

結論

この研究は、AI に「人間が教えたこと」を覚えるだけでなく、**「環境そのものと向き合い、自分でスキルを構築する」という新しい道を示しました。これにより、AI は単なる「指示されたことを行うロボット」から、「新しい環境でも即座にプロとして活躍できる自律的なパートナー」**へと進化しつつあります。

将来的には、この「OSExpert」の考え方が、ロボットが物理的な道具を使う練習をしたり、エンジニアが新しいプログラミング言語を習得したりする際にも応用されるかもしれません。