ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

本論文は、自律走行、ロボティクス、ドローンなど多様な物理的実体における汎用性を可能にする共通基盤として「空間知能」に着目し、共有基盤の構築、専門化、そしてモデル統合を行う SSR パラダイムと GRPO を採用した汎用型基盤脳「ACE-Brain-0」を提案し、24 のベンチマークで最先端の性能を達成したことを報告しています。

Ziyang Gong, Zehang Luo, Anke Tang, Zhe Liu, Shi Fu, Zhi Hou, Ganlin Yang, Weiyun Wang, Xiaofeng Wang, Jianbo Liu, Gen Luo, Haolan Kang, Shuang Luo, Yue Zhou, Yong Luo, Li Shen, Xiaosong Jia, Yao Mu, Xue Yang, Chunxiao Liu, Junchi Yan, Hengshuang Zhao, Dacheng Tao, Xiaogang Wang

公開日 2026-03-04
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

ACE-Brain-0:あらゆる「体」を持つロボットのための万能な脳

この論文は、**「車」「ドローン」「人型ロボット」**など、形も動きも全く違うさまざまな機械(ロボット)が、**たった一つの「頭脳(脳)」**で賢く動けるようになる方法を紹介しています。

この新しい脳の名前は**「ACE-Brain-0」**です。

🧠 従来の問題:なぜ「万能な脳」を作るのは難しいのか?

これまで、ロボットに「運転」も「空を飛ぶ」ことも「家事」も教えるには、以下の 2 つの失敗パターンがありました。

  1. 全部混ぜて教える(Joint Training):
    • 運転のデータ、空からの写真、家事の動画などを全部混ぜて一度に教えると、脳が混乱します。
    • 例え: 「料理のレシピ」と「車の運転マニュアル」を同時に読ませたら、脳が「油を注ぐ」のか「アクセルを踏む」のか分からず、両方とも下手になるようなものです。
  2. 順番に教える(Sequential Training):
    • まず運転を覚えさせ、次に空を飛ぶことを覚えさせると、「運転の記憶」が飛んでしまいます(これを「忘却」と呼びます)。
    • 例え: 数学を勉強し直したら、国語の知識が頭から消えてしまったようなものです。

✨ ACE-Brain-0 の解決策:「3 つのステップ」で賢くする

ACE-Brain-0 は、**「SSR(Scaffold-Specialize-Reconcile)」**という 3 つのステップで、この問題を解決します。

ステップ 1:共通の「足場(Scaffold)」を作る

まず、すべてのロボットに共通する**「3 次元空間の感覚」**だけを徹底的に教えます。

  • 例え: 車もドローンもロボットも、**「壁の向こうに何があるか」「距離はどれくらいか」「自分がどこにいるか」**という「空間の感覚」は共通です。
  • ここでは、**「空間の専門家」**という脳を作ります。これは、どんな形をしたロボットでも使える「共通の土台(足場)」になります。

ステップ 2:専門家を育てる(Specialize)

次に、その「空間の専門家」をベースに、それぞれの分野の「専門家」を別々に育てます。

  • 車の専門家: 道路のルールや車の動きを学びます。
  • ドローンの専門家: 空からの視点や風の影響を学びます。
  • ロボットの専門家: 物を掴む細かい動きを学びます。
  • ポイント: これらは別々の部屋で勉強するので、お互いに邪魔し合いません。

ステップ 3:知識を統合する(Reconcile)

最後に、それぞれの「専門家」の知識を、新しいデータを教え直すことなく、数学的なテクニックを使って 1 つの脳に合体させます。

  • 例え: 料理の名人、車のプロ、飛行機のパイロットが、それぞれ持っていた「最高の知識」を、**「記憶の融合」**という魔法で 1 人の「万能な天才」にまとめます。
  • これにより、「運転を忘れる」ことも「混乱すること」もありません。

🚀 この脳が何ができるか?

この「ACE-Brain-0」は、24 種類のテストでトップクラスの結果を出しました。

  • 空間認識: 「ソファとテレビの距離は?」と聞けば、正確に答えられます。
  • 自動運転: 複雑な交差点で「次に曲がるべきか?」を判断できます。
  • ドローン: 上空から「どの車が止まっているか」や「建物の高さ」を計算できます。
  • ロボットアーム: 「コップをどこに置けばいいか」「次にどのボタンを押すべきか」を計画できます。

🌟 まとめ:なぜこれがすごいのか?

これまでのロボットは、「車用脳」「ドローン用脳」「ロボット用脳」と分かれていましたが、ACE-Brain-0 は**「空間を理解する」という共通の土台**を共有することで、1 つの脳ですべての形に対応できることを証明しました。

まるで、「日本語(空間感覚)」を完璧にマスターした人が、その土台の上に「料理(ロボット)」や「運転(車)」や「飛行(ドローン)」のスキルを次々と習得し、最終的に「何でもできる天才」になるようなイメージです。

これにより、将来は「車も空も飛べ、家も掃除できる」ような、本当に万能な AI 体が実現するかもしれません。