InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

本文提出了 InterReal 框架,这是一个统一的基于物理的模仿学习系统,通过引入带接触约束的运动数据增强方案和自动奖励学习机制,实现了人形机器人对真实世界人机交互(HOI)技能的高效学习与鲁棒部署。

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 InterReal 的新框架,它的目标是教人形机器人像真人一样,灵活、自然地与物体进行互动(比如搬箱子、推箱子)。

为了让你更容易理解,我们可以把机器人学技能的过程想象成教一个刚出生的“机器人婴儿”学习做家务

1. 以前的困难:只会“摆姿势”,不会“干活”

以前的机器人训练方法,就像是在教机器人跳广场舞

  • 现状:机器人能学会走路、跳舞、甚至翻跟头(这些叫“全身控制”)。
  • 问题:一旦让它去拿一个沉重的箱子,或者推一个会滑动的物体,它就懵了。因为它只学会了“摆出好看的姿势”,却不懂物理规则
    • 比喻:就像你让一个只会模仿动作的演员去搬砖,他可能摆出了搬砖的姿势,但手一碰到砖,砖就飞了,或者他自己摔倒了,因为他不知道砖头有多重,也不知道手该怎么用力。

2. InterReal 的两大“独门秘籍”

为了解决这个问题,作者给机器人设计了两套“特训方案”:

秘籍一:运动数据“增广” —— 像练“抗干扰”一样练手

在现实世界里,物体不会乖乖待在原地。箱子可能放歪了,或者你推的时候它滑了一下。

  • 以前的做法:机器人只练一种情况(箱子在正中间)。
  • InterReal 的做法:他们给机器人搞了一场“混乱特训”。
    • 比喻:想象你在教孩子系鞋带。以前你只让他系放在桌子正中间的鞋带。现在,InterReal 会把鞋带放在桌子左边、右边、甚至稍微歪一点的地方,让孩子反复练习。
    • 原理:通过数学方法(逆运动学),他们生成了成千上万种“箱子位置稍微不同”的练习场景,但手和箱子接触的细节(比如手指怎么扣住把手)。
    • 效果:机器人练熟了,就算现实中箱子放歪了,它也能瞬间调整手臂角度,稳稳抓住,不会像以前那样因为一点偏差就“崩溃”。

秘籍二:自动奖励“教练” —— 一个会看情况的“智能教练”

在训练机器人时,我们需要给它打分(奖励)。比如:手离箱子近了给 1 分,站稳了给 1 分,没摔倒给 1 分。

  • 以前的做法:教练(人类)手动设定规则:“只要手靠近箱子,就给 10 分”。这很死板。
    • 问题:在动作刚开始时,保持平衡最重要;在动作快结束时,抓稳箱子最重要。死板的规则会让机器人顾此失彼。
  • InterReal 的做法:他们请了一位**“超级 AI 教练”**(元策略)。
    • 比喻:这位教练手里拿着一个动态评分表
      • 当机器人刚起步,摇摇晃晃时,教练会大喊:“现在平衡最重要!把平衡的分数权重调高!”
      • 当机器人快抓到箱子时,教练会喊:“现在抓握最重要!把抓握的分数权重调高!”
    • 原理:这个 AI 教练会实时观察机器人的表现(比如关节角度、箱子位置有没有偏离),然后自动调整各个任务的“重要性权重”。它不需要人类去调参数,自己就能学会怎么给机器人“指路”。

3. 实际效果:从“模拟世界”到“真机实战”

作者把这套方法用在了真实的 Unitree G1 人形机器人身上(就是那个像人一样的四足/双足机器人)。

  • 测试任务
    1. 搬箱子:机器人要弯腰,抓起一个很重的箱子,还要走路把它放下。
    2. 推箱子:机器人要推着箱子向前走,箱子可能会歪,机器人要随时调整姿势去推。
  • 结果
    • 更准:机器人的动作跟真人示范的几乎一模一样,误差极小。
    • 更稳:在 100 次测试中,它成功的次数比以前的方法多得多(搬箱子成功率高达 96% 以上)。
    • 更聪明:即使在现实世界中,箱子被推歪了,或者传感器有点延迟,机器人也能像真人一样,实时调整自己的动作,把任务完成。

总结

这篇论文的核心思想就是:教机器人干活,不能只教它“摆样子”,要教它懂“物理”,还要给它配一个“会看眼色”的自动教练

  • 以前:机器人像是一个只会背台词的演员,稍微有点意外就忘词摔倒。
  • **现在 **(InterReal):机器人像是一个经验丰富的搬运工,不管箱子放哪,它都能灵活调整,稳稳当当把活干完。

这标志着人形机器人从“只会跳舞”向“真正能干活”迈出了重要的一步。