FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid

本文提出了名为 FAME 的力自适应强化学习框架,通过结合上肢姿态与双手机械交互力的潜在上下文编码,使全尺寸人形机器人(如 Unitree H12)能够在无需腕部力/力矩传感器的情况下,显著提升在外部力扰动下的站立平衡能力与操作范围。

Niraj Pudasaini, Yutong Zhang, Jensen Lavering, Alessandro Roncone, Nikolaus Correll

发布于 Wed, 11 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种名为 FAME 的新方法,旨在让人形机器人(比如 Unitree H12 这种像真人的大机器人)在手里拿着重物或被人推搡时,依然能稳稳地站着,不会摔倒。

为了让你更容易理解,我们可以把这篇论文的核心思想想象成教一个杂技演员如何在“负重”和“被推”的情况下保持平衡

1. 核心问题:为什么机器人容易摔倒?

想象一下,你双手平举,手里各拿一个很重的哑铃。这时候,如果有人从侧面推你一下,或者你突然想把手里的东西举得更高,你的身体重心会发生剧烈变化。

  • 传统机器人的困境:以前的机器人就像是一个只会按固定程序走路的“死板”人。它知道怎么走路,但如果手里突然多了个重物,或者手臂摆出了奇怪的姿势,它的大脑(控制程序)就懵了:“哎呀,我现在的姿势不对,重心偏了,但我不知道该怎么调整腿脚来抵消这个力!”结果就是——摔倒
  • 所谓的“操作包络”(Manipulation Envelope):论文里提到的这个词,其实就是指机器人能安全站立并完成任务的“安全范围”。如果机器人只能在不拿东西、手臂放低时站立,那它的“安全范围”就很窄。FAME 的目标就是把这个范围扩大,让机器人能扛着更重的东西、摆出更奇怪的姿势还能站稳。

2. FAME 是怎么做到的?(三大法宝)

FAME 的核心在于给机器人装了一个"超级直觉",让它能实时感知并适应手上的力量。

法宝一:给机器人装上“第六感”(潜变量编码器)

  • 比喻:想象一个经验丰富的老练杂技演员。当他手里拿东西时,他不需要用尺子去量“我手里有多少牛顿的力”,他通过感觉(肌肉的紧张度、身体的倾斜)就能瞬间知道:“哦,左边重了,我得把右腿稍微用力顶一下。”
  • 技术实现:FAME 训练了一个AI 编码器。这个编码器就像一个“翻译官”,它把机器人手臂的位置(关节角度)和手上的受力情况(力的大小和方向)打包成一个隐形的“上下文信号”(Latent Context)。
  • 作用:这个信号直接告诉控制腿部的“大脑”:“嘿,现在的状态是‘左手举高且受力’,请立刻调整腿部策略来平衡!”这让机器人不再是盲目地乱动,而是有的放矢地调整。

法宝二:在虚拟世界里“地狱级”特训(课程学习)

  • 比喻:就像练武的人不能一开始就练“单手倒立”,得从站桩开始。FAME 在训练机器人时,设计了一套循序渐进的“魔鬼课程”
    • 第一阶段:让机器人手臂保持不动,只练习站立。
    • 第二阶段:慢慢让手臂动起来,摆出各种奇怪的姿势。
    • 第三阶段:在机器人手臂摆动的同时,从四面八方(像球一样随机)给它施加各种推力(模拟被人推或拿重物)。
  • 作用:通过在模拟环境中经历成千上万种“被推”和“摆姿势”的组合,机器人学会了见招拆招。它不再害怕未知的力量,因为它在训练时已经“见”过所有可能的情况了。

法宝三:不用传感器也能“猜”出受力(无传感器部署)

  • 比喻:通常,要感知手上的力,需要在手腕上装昂贵的“力传感器”(就像给机器人戴了个特制的手套)。但 FAME 很聪明,它不需要这个手套
  • 技术实现:它利用机器人自身的电机扭矩(电机转动的力度)和关节角度,通过物理公式(雅可比矩阵)反推出来:“既然我的电机用了这么大的劲,而手臂又在这个角度,那说明我的手肯定受到了一个向下的力。”
  • 作用:这大大降低了成本,让机器人更容易在现实世界中部署,因为不需要额外的昂贵硬件。

3. 实验结果:真的有用吗?

论文在仿真和真实的 Unitree H12 机器人上做了测试:

  • 没有 FAME 的机器人:在手臂摆出奇怪姿势或受力时,成功率只有 29% 左右。就像个新手,稍微有点风吹草动就摔了。
  • 只有“课程训练”但没有“第六感”的机器人:成功率提升到了 51%。就像个练过基本功但不懂变通的人,能应付一些情况,但遇到复杂情况还是懵。
  • FAME 机器人(既有课程又有第六感):成功率飙升到 73.8%
    • 真实场景演示:在真实的 Unitree H12 上,当机器人单手提着 30 牛顿(约 3 公斤)的重物,或者双手对称提重物时,FAME 能让它稳稳站立,关节位置几乎不变;而没有 FAME 的机器人,关节会乱晃,最后直接摔倒。

4. 总结

这篇论文就像是在教机器人如何像人一样“灵活”地站立

以前的机器人像木头人,只能按固定程序走;FAME 让机器人变成了有经验的杂技演员

  1. 它能感知手上的重量和姿势(通过 AI 编码器)。
  2. 它经历过各种刁钻的考验(通过模拟训练)。
  3. 不需要昂贵的传感器就能算出力的大小(通过物理推算)。

最终效果:机器人能扛着更重的东西、摆出更难的姿势,依然站得稳如泰山。这意味着未来的人形机器人能真正走进工厂、家庭,帮我们搬重物、做家务,而不用担心一用力就把自己摔个“狗吃屎”。