APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

本論文は、強化学習の安全性制約下で効率的な探索を可能にする「一般化されたラチェット進行報酬」を導入し、LiDAR に基づく知覚とシミュレーション・リアリティのギャップ低減手法を組み合わせることで、29 自由度のヒューマノイドロボットが脚長を超える高さ(0.8 メートル)のプラットフォームへの登降や姿勢変換を含む複合動作をゼロショットで実世界に適用可能にした「APEX」システムを提案するものである。

Yikai Wang, Tingxuan Leng, Changyi Lin, Shiqi Liu, Shir Simon, Bingqing Chen, Jonathan Francis, Ding Zhao

公開日 2026-03-09
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

APEX:ロボットが「階段」を登るための新しい知恵

この論文は、**「人型ロボットが、自分の足の高さよりもずっと高い段差(例えば、テーブルの上)を、ジャンプではなく『登る』ようにして乗り越える方法」**を提案した研究です。

従来のロボットは、高い場所に行くために「ジャンプ」しようとしていましたが、それは足が短すぎたり、力が足りなかったりして危険でした。そこで、この研究チームは、**「人間が壁を登るような、全身を使って慎重に移動する」**という新しいアプローチを開発しました。

以下に、専門用語を避け、身近な例え話を使って解説します。


1. 従来の「ジャンプ」と、新しい「登る」の違い

  • 従来の方法(ジャンプ):
    高い壁を越えようとして、バネのように勢いよく飛び跳ねようとします。
    • 問題点: 壁が高すぎると、着地の衝撃でロボットが壊れてしまったり、壁に届かなかったりします。まるで、背の低い人が高い棚に手を伸ばして、無理やり飛びつくようなものです。
  • APEX の方法(登る):
    壁を飛び越えるのではなく、**「手を使って、足をかけて、体をよじり登る」**ようにします。
    • メリット: 全身(手、足、体幹)を使って体重を分散させるため、衝撃が少なく、安全に高い場所(自分の脚の長さの 114% も!)に到達できます。

2. ロボットが覚えた「6 つの特技」

このロボットは、単一の動きではなく、状況に合わせて使い分ける6 つのスキルをマスターしました。

  1. 登る(Climb-up): 高い段差に手をつき、足をかけて登る。
  2. 降りる(Climb-down): 高い場所から、手と足を使って慎重に降りる。
  3. 立つ(Stand-up): 床に寝転がった状態から、ゆっくりと立ち上がる。
  4. 寝る(Lie-down): 立った状態から、安全に床に寝転がる。
  5. 歩く(Walk): 平らな場所を歩く。
  6. 這う(Crawl): 低い姿勢で這うように移動する。

これらを組み合わせて、ロボットは「歩く → 登る → 這う → 立つ → 歩く」といった一連の流れを、人間が階段を昇り降りするのと同じように自然に行います。

3. 成功の鍵:「進歩の記録帳(ラチェット・プログレス・リワード)」

ここで最も面白いのが、ロボットに何を「褒めるか」という学習方法です。

  • 従来の学習(ゴールまでの距離):
    「ゴールに近づくほど褒める」とすると、ロボットは「近づくこと」だけに集中し、**「ゴールに近づいて、また少し離れて、また近づく」**という無駄な動きを繰り返して点数を稼いでしまうことがあります(これを「ごまかし」と言います)。
  • APEX の学習(進歩の記録帳):
    ここでは、**「これまでで一番進んだ位置」を記録し、「それより前に戻ったら罰点、それより前に進めたら褒美」**というルールにしました。
    • 例え話: 登山で「これまでの最高地点」を記録します。もし「下山」したり「同じ場所に戻ったり」したら、その行為は評価されません。常に「新しい高み」を目指さないと、ロボットは褒められません。
    • 効果: これにより、ロボットは焦って飛び跳ねるのではなく、「一歩ずつ確実に、安全に」登る方法を自ら発見しました。

4. 現実世界への挑戦:「目」の補正

ロボットはシミュレーション(仮想空間)で練習しますが、現実世界ではカメラやセンサーのデータにノイズ(ゴミ)が入ることがあります。

  • 問題: 壁が見えなかったり、見えないはずの壁が見えたりする「幻覚」のようなエラーが起きます。
  • 解決策:
    1. 練習中に「幻覚」を見せる: 練習の段階から、あえてノイズのあるデータをロボットに見せて、混乱に慣れさせました。
    2. 現地で「掃除」をする: 実際の運用では、センサーのデータをリアルタイムで整理・修復するフィルターを使います。
      これにより、ロボットはどんなに汚れたデータでも、正しい地形を認識して登ることができます。

5. 実験結果:Unitree G1 による実証

研究チームは、29 個の関節を持つ実機ロボット「Unitree G1」を使って実験を行いました。

  • 結果: 脚の長さよりも高い0.8 メートルのプラットフォームを、ジャンプすることなく、**「登る → 歩く → 降りる」**という一連の動作を、一度も失敗せずに成功させました。
  • 驚異的な適応力: 突然後ろから蹴られてバランスを崩しても、すぐに立ち直り、登る動作を再開しました。まるで、壁を登っている人間が風で揺られても、手と足でしっかり掴み直して登り続けるようなものです。

まとめ

この論文「APEX」は、人型ロボットに**「ジャンプという荒業」ではなく、「全身を使った丁寧な登り」を学ばせる**ことに成功しました。

  • キーポイント: 「進歩の記録帳」のような新しい学習ルールと、ノイズに強い「目」の技術。
  • 未来: これにより、ロボットは災害現場の瓦礫の上や、段差の多い家の中など、人間が住む複雑な環境で、より安全に、賢く動けるようになるでしょう。

まるで、**「背の低い子供が、高い棚のオモチャを取るために、椅子を積み重ねて登る」**ような、知恵と工夫の詰まったロボット技術です。