Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

本文提出了 EAGLE 框架,通过一种迭代式的通用体与专家体蒸馏机制,成功训练出无需针对特定机器人调整奖励即可控制多种异构人形机器人的统一全身控制器,显著提升了跨平台泛化能力与行为多样性。

Quanquan Peng, Yunfeng Lin, Yufei Xue, Jiangmiao Pang, Weinan Zhang

发布于 2026-03-02
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 EAGLE 的新方法,旨在解决机器人界的一个大难题:如何让同一个“大脑”(控制策略)去指挥不同长相、不同身材的机器人,而且还能让它们学会走路、下蹲、甚至歪身子等复杂动作?

为了让你更容易理解,我们可以把这项技术想象成**“培养超级机器人教练”**的过程。

1. 以前的痛点:每个机器人都有“专属教练”

想象一下,你有一群学生(机器人),他们有的高(Unitree H1),有的矮(Unitree G1),有的腿长,有的关节多。

  • 过去的方法:如果你想教高个子学生跑步,你得请一位专门教高个子的教练;想教矮个子学生,又得请一位专门教矮个子的教练。
  • 问题:每换一个机器人,就得重新训练、重新调整奖励规则(比如:高个子跑快了给奖励,矮个子跑快了可能奖励规则就不一样了)。这太慢了,而且很难让一个通用的“大脑”同时指挥所有人。

2. EAGLE 的核心创意:通用教练 + 专科专家 + 循环进修

EAGLE 提出了一套**“通才(Generalist)”与“专才(Specialist)”互相学习的循环系统**。我们可以把它比作一个**“师徒传承与进修”**的闭环:

第一步:培养“通才教练” (The Generalist)

首先,我们训练一个**“通才教练”。这个教练没见过具体的某个学生,但他看过很多不同身材学生的模拟视频。他学会了一套通用的指挥语言**,比如:“向前走”、“身体前倾”、“蹲下”。

  • 关键点:这个教练不针对任何特定身材,他试图掌握所有身材的共性。

第二步:分派“专科专家” (The Specialists)

然后,我们把这位“通才教练”复制 N 份,派给每一个具体的机器人(比如派一份给高个子,一份给矮个子)。

  • 专科进修:这些“分身”现在只负责教自己那个特定的机器人。因为只盯着一个学生,他们能迅速发现:“哦,原来这个高个子腿长,蹲下时膝盖要弯更多角度才稳。”
  • 于是,这些“专科专家”变得非常精通自己那个机器人的特性。

第三步:知识回流 (Distillation)

这是最精彩的一步。这些“专科专家”把自己学到的独家秘籍(比如高个子怎么蹲最稳,矮个子怎么歪身子不掉倒)提炼出来,教回给原来的“通才教练”

  • 循环升级:通才教练吸收了所有专家的秘籍,变得更聪明了。
  • 重复:然后,通才教练再次分身,派去教机器人,专家再升级,再回流。
  • 结果:经过几轮循环,这个“通才教练”变得无所不能。他不需要针对每个机器人重新设定规则,只要给他一个指令(比如“下蹲”),他就能根据机器人的身材自动调整动作,让所有人都做得很好。

3. 他们做了什么特别的创新?

A. 统一的“指挥语言” (Unified Command)

以前的机器人控制,指令很单一,比如“向前走”。
EAGLE 发明了一种**“全能指令包”**。就像给机器人一个遥控器,上面不仅有“走”的按钮,还有“身体倾斜角度”、“身体高度(蹲下或站高)”的滑块。

  • 比喻:以前只能指挥机器人“走直线”;现在可以指挥它“一边向左走,一边慢慢蹲下,同时身体向前倾”。这让机器人能做出更丰富、更像人的动作。

B. “看穿”机器人身材 (Embodiment-Aware)

为了让通才教练能区分不同身材,他们给教练戴上了一副**“透视眼镜”**(Embodiment-aware Observation)。

  • 比喻:在训练时,教练不仅能看到动作,还能“看到”机器人的骨骼结构(比如腿有多长、关节在哪里)。这就像教练知道“这个学生腿长,所以步幅要大”,从而避免用教短腿学生的方法去教长腿学生。

4. 实验结果:真的行得通吗?

作者们在电脑模拟里测试了 5 种不同长相的机器人,并在现实世界中让 4 种真实的机器人(包括 Unitree H1, G1 等)进行了测试。

  • 零样本迁移 (Zero-shot):这意味着,训练好的模型直接放到新机器人上,不需要重新训练,机器人就能立刻听懂指令并做出动作。
  • 表现:在走路、下蹲、身体倾斜等动作上,EAGLE 的准确度比以前的方法高得多,而且非常稳定,不容易摔倒。

总结

这篇论文就像是在说:

我们不再需要为每个机器人单独请一个教练。我们创造了一个**“超级大脑”,它通过让“分身”去各个机器人身上实习,再把学到的经验汇总回来,最终变成了一个全能教练**。

无论机器人是高是矮、是胖是瘦,只要给这个大脑一个指令(比如“去倒杯水”),它就能自动计算出最适合那个机器人身材的动作,让它稳稳地完成任务。

这标志着机器人控制向着**“规模化、通用化”**迈出了重要一步,未来我们可能只需要训练一次,就能指挥一大群不同型号的机器人协同工作。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →