SAC-Loco: Safe and Adjustable Compliant Quadrupedal Locomotion

本文提出了一种名为 SAC-Loco 的安全感知柔顺运动框架,该框架通过结合可调节柔顺的强化学习策略、安全导向的恢复策略以及实时安全监督机制,使四足机器人能够在无需显式力传感器的情况下,在外部力干扰下同时实现平滑的柔顺响应与鲁棒的安全保障。

Aoqian Zhang, Zixuan Zhuang, Chunzheng Wang, Shuzhi Sam Ge, Fan Shi, Cheng Xiang

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 SAC-Loco 的新系统,它让四足机器人(比如机器狗)变得既听话聪明,特别是在面对外力推搡或拉扯时。

为了让你更容易理解,我们可以把这只机器狗想象成一个在拥挤人群中跳舞的舞者,或者一个正在推着重物行走的搬运工

1. 核心问题:以前的机器狗太“硬”或太“软”

以前的机器狗控制方法主要有两个缺点:

  • 太硬(像机器人): 它们试图死死地抵抗任何外力。如果有人推它,它会像一堵墙一样硬抗,结果往往是把自己推倒,或者把推它的人弹飞。
  • 太软(像面条): 有些方法让它们变得很顺从,但一旦外力太大,它们就彻底失去平衡,像醉汉一样摔倒,而且无法自己站起来。

SAC-Loco 的目标是: 让机器狗像真正的动物(比如猫或狗)一样。

  • 当有人轻轻推它时,它能顺势借力,调整步伐继续走(这叫“顺应”)。
  • 当有人猛力推它,快要把它推倒时,它能瞬间爆发,做出高难度的动作把自己救回来(这叫“安全”)。
  • 最重要的是,人类可以调节它有多“顺从”。你可以让它像石头一样硬抗,也可以让它像水一样随波逐流。

2. 它的“超能力”是怎么来的?(三个核心模块)

作者给机器狗装上了三个“大脑模块”,它们配合工作:

A. “顺从教练” (Compliant Policy) —— 学会“顺势而为”

  • 比喻: 想象你在学游泳。教练(Teacher)在水里给你看水流的方向,告诉你怎么游最省力。但真正的游泳者(Student)上岸后,看不见水流,只能靠身体的感觉(本体感觉)来游。
  • 原理: 研究人员先用一个拥有“上帝视角”(知道所有外力数据)的老师在模拟器里训练,教机器狗如何根据外力调整步伐。然后,把这个老师的经验“蒸馏”(浓缩)给学生
  • 结果: 学生机器狗虽然看不见外力,但通过观察自己身体的姿态和历史动作,就能像老师一样,灵活地调整步伐来顺应外力。你可以通过一个旋钮(参数 kk)来告诉它:“今天我们要硬一点”或者“今天我们要软一点”。

B. “急救专家” (Safe Policy) —— 学会“绝地反击”

  • 比喻: 当那个舞者快要摔倒了,普通的反应是乱抓空气。但“急救专家”会立刻计算重心,像杂技演员一样,迅速把脚伸到身体重心下方,或者转身把背对着推力,利用身体的结构把推力变成向前的动力,从而把自己救回来。
  • 原理: 这个模块专门负责处理那些“顺从教练”搞不定的巨大外力。它利用一种叫“修正捕获点”的物理原理,计算出机器人必须把脚踩在哪里才能不倒。
  • 结果: 当外力大到快要摔倒时,这个模块会接管控制权,让机器人做出跳跃、转身等高难度动作来恢复平衡。

C. “安全裁判” (Safety Critic) —— 聪明的“守门员”

  • 比喻: 这是一个站在场边的裁判。他时刻盯着机器狗的状态。
    • 如果机器狗只是被轻轻推了一下,裁判说:“没事,继续用‘顺从教练’的方法,顺势走。”
    • 如果裁判发现机器狗快要摔了(比如身体倾斜角度太大),他会立刻吹哨:“危险!切换模式!”然后马上把控制权交给“急救专家”。
  • 原理: 这是一个经过训练的神经网络,它能实时判断当前的状态是否安全。如果它觉得危险,就自动切换策略。

3. 实验效果:它有多强?

作者在电脑模拟和真实的机器狗(Unitree Go2)上做了很多测试:

  • 拉椅子测试: 他们让机器狗拉着一个坐着人的办公椅。
    • 如果把“顺从度”调低,机器狗就像个倔强的壮汉,拉得很快,但很费力。
    • 如果把“顺从度”调高,机器狗就像个温柔的助手,拉得慢一点,但很省力,甚至能配合人的节奏。
  • 大力推搡测试: 有人用绳子猛拉机器狗,试图把它弄倒。
    • 以前的方法(HAC-Loco, FACET)在大力拉扯下经常失败(摔倒)。
    • SAC-Loco 在 5 次测试中一次都没摔倒! 即使被拉得快要失去平衡,它也能迅速转身,把背对着拉力,像壁虎一样吸住地面,然后重新站稳。
  • 力量对比: 它能承受的最大拉力比之前的方法高出很多(比如能拉动 10 公斤以上的重物而不倒)。

4. 总结:为什么这很重要?

这就好比给机器人装上了**“本能”
以前的机器人是死板的程序,遇到意外就死机或摔倒。
SAC-Loco 让机器人拥有了像动物一样的
生存本能**:

  1. 可调节: 人类可以决定它是“硬汉”还是“软妹”。
  2. 安全: 遇到危险能自己救自己,不会轻易摔倒。
  3. 无感: 不需要在机器人身上装很多昂贵的力传感器,它靠“身体感觉”就能做到。

这项技术让机器狗未来能更安全地进入人类家庭(比如帮老人推东西、在拥挤的街道上行走),即使被不小心撞到,也能稳稳地站住,不会把东西摔坏或把人撞伤。