Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task

该论文提出了一种名为 DEFT 的基于扩散模型的轨迹生成方法,通过结合机器人当前本体状态与任务约束,实现了在任意执行器故障下仍能安全完成受限及非受限任务的“故障激活”操作,并在仿真与真实世界实验中显著超越了传统基线方法。

Gilberto G. Briscoe-Martinez, Yaashia Gautam, Rahul Shetty, Anuj Pasricha, Marco M. Nicotra, Alessandro Roncone

发布于 2026-03-12
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于如何让机器人在“受伤”后依然能坚持工作的故事。

想象一下,如果你扭伤了脚踝,你还能走路吗?当然可以,只是你会换一种姿势,比如一瘸一拐,或者用另一只脚多使点劲。如果你手指受伤了,你还能写字吗?可以,只是你会用另一只手,或者用笔杆夹着写。

人类天生具备这种**“带伤上阵”(Fail-Active)**的能力。但现在的机器人一旦某个关节坏了(比如电机卡死、转不动了),它们通常会立刻“死机”报警,等着人类来修。这就好比机器人一扭伤脚踝就立刻躺平不动了,这显然效率太低。

这篇论文提出了一种名为 DEFT 的新方法,让机器人像人类一样,在受伤后能**“灵活应变,继续干活”**。

1. 核心概念:把“受伤”变成“新身体”

作者认为,当机器人的某个关节坏了(比如不能转了,或者转得慢了),它其实并没有“坏掉”,只是变成了一个**“新身体”**。

  • 正常身体:手能转 360 度。
  • 受伤身体:手只能转 90 度,或者只能慢悠悠地转。

DEFT 就像一个超级聪明的“身体适应教练”。它不关心机器人原本长什么样,它只关心**“现在的身体能做什么,不能做什么”**。它会根据机器人当前的“伤情”,重新规划动作。

2. DEFT 是怎么工作的?(三个关键魔法)

DEFT 使用了一种叫**“扩散模型”(Diffusion Model)的 AI 技术。你可以把它想象成一个“在迷雾中画图的艺术家”**:

  • 魔法一:身体编码(Embodiment Encoding)
    这就好比给机器人发一张**“体检报告”**。报告上写着:“左腿膝盖只能弯曲 30 度,右臂速度减半”。DEFT 拿到这张报告,就知道:“哦,现在的身体是这种状态,我得按这个状态来规划动作。”

    • 比喻:就像你穿了一双不合脚的鞋,你走路时会下意识地调整步伐,DEFT 就是那个能瞬间计算出新步伐的“大脑”。
  • 魔法二:任务约束(Constraint Conditioning)
    机器人干活有两种模式:

    1. 自由模式:比如把杯子从桌上拿到架子上,只要不撞墙,怎么动都行。
    2. 受限模式:比如用抹布擦黑板,手必须贴着黑板,不能飞起来,也不能歪着擦。
      DEFT 能听懂这两种指令,并生成对应的动作。
  • 魔法三:起点终点“填空”(Inpainting)
    这是最关键的一步。不管机器人怎么受伤,它必须从A 点出发,到达B 点

    • 比喻:就像你在画一条路,虽然中间的路塌了(关节坏了),但你必须保证起点终点是连上的。DEFT 会强行把起点和终点“钉”在正确的位置,然后像填字游戏一样,把中间受伤路段的走法“填”出来。

3. 它有多厉害?(实验结果)

作者让机器人(一个 7 个关节的机械臂)在模拟环境和真实世界中进行了测试,甚至故意把关节“弄坏”(锁死、限制速度)。

  • 对比传统方法

    • 传统的机器人规划方法(像 RRT 算法)在关节坏了的时候,就像是一个死板的导航仪。一旦路断了,它就只会说“无法到达”,成功率只有 42%
    • DEFT 则像是一个经验丰富的老司机。路断了?没关系,我绕道走,或者换个姿势开。在自由移动的任务中,DEFT 的成功率高达 99.5%!在需要贴着物体擦、推的困难任务中,成功率也达到了 46%(传统方法只有 30%)。
  • 真实世界测试
    作者让机器人做了两个任务:

    1. 拉开抽屉放东西:机器人需要拉抽屉、推物体、抓取、放入、关抽屉。
    2. 擦白板:机器人要拿起板擦,贴着白板来回擦。

    在关节严重受损(比如某个关节完全锁死)的情况下,传统的优化算法完全瘫痪,根本动不了。而 DEFT 依然能完美完成任务,动作流畅,没有掉落物体,也没有撞坏东西。

4. 总结:为什么这很重要?

这篇论文的核心思想是:不要等到机器人完全坏了才停下来,要让它学会“带伤奔跑”。

  • 以前:机器人坏了 = 停机 = 人类去修 = 浪费时间。
  • 现在(DEFT):机器人坏了 = 自动调整策略 = 继续干活 = 人类不用管。

这就好比未来的火星探测器,如果它的轮子卡住了,它不需要等待地球上的指令,而是自己想办法用剩下的轮子或者机械臂把自己“挪”到目的地。

一句话总结
DEFT 给机器人装上了一个**“超级适应力”**,让它即使身体“残疾”了,也能像人类一样,换个姿势、换个策略,依然能把活儿干漂亮。这是迈向真正自主、可靠的机器人的一大步。