InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

本論文は、実世界の人間 - 物体相互作用(HOI)制御を可能にする統合された物理ベースの模倣学習フレームワーク「InterReal」を提案し、接触制約を考慮したデータ拡張とメタポリシーに基づく自動報酬学習により、Unitree G1 などの実機において高い追従精度とタスク成功率を実現したことを示しています。

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai

公開日 Tue, 10 Ma
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

この論文は、**「人型ロボットが、人間のように箱を運んだり押したりする『手作業』を、失敗せずに自然に覚えるための新しい教え方」**について書かれたものです。

タイトルは『InterReal(インターリアル)』。まるで「現実世界で通用する、ロボットと物の相互作用(ホウ)」を可能にする魔法の教科書のような存在です。

わかりやすく、3 つのポイントと、それにまつわる「お料理の例え」で説明しますね。

1. 従来のロボットは「お人形さん」だった

これまでの人型ロボットは、歩く、走る、ジャンプするといった「全身運動」は得意でした。でも、**「箱を掴んで運ぶ」「箱を押して動かす」**といった、物と触れ合う作業になると、とたんに失敗したり、箱を落としてしまったりしていました。

  • 例え話:
    従来のロボットは、**「ダンスは上手いけど、料理はできないお人形さん」**のようなもの。
    音楽に合わせて踊る(歩く)のは得意ですが、包丁を持って野菜を切ったり(箱を運ぶ)、重い鍋を運んだりするのは、手元が狂って失敗してしまいます。なぜなら、物との「触れ合い」を計算しきれていなかったからです。

2. InterReal の「2 つの魔法」

この研究では、ロボットが失敗しないようにするために、2 つの特別な工夫(魔法)を取り入れました。

① 「もしも」の練習(モーション拡張)

ロボットに「箱を運ぶ」動きを教えるとき、いつも同じ位置にある箱を運ぶだけだと、実際の現場で箱が少しずれていたらロボットはパニックになります。
そこで、**「箱が左にずれていたらどうするか」「右にずれていたらどうするか」**という、無数の「もしも」のシチュエーションを、AI が自動的に作り出して練習させました。

  • 例え話:
    料理の練習で、**「いつも同じ位置にある玉ねぎを切る」だけでは、実際の台所では玉ねぎが転がって来ても対応できません。
    InterReal は、
    「玉ねぎが転がって来たら、手首をこう動かしてキャッチする」「位置がズレたら、足で踏ん張ってバランスを取る」**という、ありとあらゆる「もしも」のシチュエーションを、シミュレーションの中で何千回も練習させます。これにより、本番で箱がズレても、ロボットは慌てずに対応できるようになります。

② 「自動採点先生」の登場(自動報酬学習)

ロボットを教えるとき、「正解の動き」に近づいたら「ご褒美(報酬)」をあげます。でも、「どのくらいご褒美をあげればいいか」を決めるのは人間にとって非常に難しく、失敗しやすいポイントでした。
そこで、**「今の動きがどれだけ間違っているか」を見て、自動的に「ご褒美の配分」を調整する AI(メタポリシー)」**を作りました。

  • 例え話:
    料理の練習で、「先生(AI)」が常に横についています。

    • 最初は「バランスを取る」ことが一番大事だから、バランスの点数を高く評価します。
    • 箱を持ち上げたら、「箱を落とさないこと」が大事だから、そちらの点数を高くします。
    • 箱を押し始めたら、「箱の位置を正確に押すこと」にポイントを集中させます。

    従来の方法は「先生が最初から決めた固定のルール」で採点していましたが、InterReal の先生は**「今の状況に合わせて、採点基準をリアルタイムで変える」**ことができます。これにより、ロボットは最短で最も上手な動きを身につけられます。

3. 実機での成功(Unitree G1)

この「魔法の教え方」を、実在する人型ロボット(Unitree G1)で試しました。
結果、**「箱を拾って運ぶ」「箱を押し続ける」**という難しい作業でも、ロボットは箱の位置がズレても、その場でバランスを取りながら、箱を上手に扱って任務を成功させました。

  • 例え話:
    練習場(シミュレーション)で「もしも」の練習と「自動採点先生」の指導を受けたロボットは、**「本番の台所」**に入っても、転がった玉ねぎを拾い上げたり、重い鍋を安定して運んだりできるようになりました。

まとめ

この論文は、**「ロボットに『物との触れ合い』を教えるのが難しい」という問題を、「無数のシチュエーションで練習させること」「状況に合わせて採点基準を変える AI 先生」**という 2 つのアイデアで解決し、実世界のロボットが人間のように器用に物を持てるようになったことを示しています。

これからのロボットは、ただ歩くだけでなく、**「家事や工場での作業」**といった、物と触れ合う仕事でも大活躍できるかもしれませんね!