DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

本文提出了 DropVLA,一种针对视觉 - 语言 - 动作(VLA)模型的动作级后门攻击方法,该方法仅需极少量数据投毒即可在保持正常任务性能的同时,通过视觉触发器精准操控机器人执行特定的安全关键动作,并已在物理机器人上验证了其有效性。

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一种针对具身智能机器人(即拥有眼睛、大脑和手臂,能像人一样在现实世界做事的 AI)的新型黑客攻击方式,名为 DropVLA

为了让你轻松理解,我们可以把这种机器人想象成一个极其听话但有点“死脑筋”的机器人管家

1. 背景:机器人管家是如何工作的?

现在的机器人管家(VLA 模型)非常聪明。你给它看一张桌子(视觉),再对它说“把苹果放到盘子里”(语言),它就能计算出手臂该怎么动、手指该怎么抓(动作),然后完美完成任务。

2. 问题出在哪里?(什么是“后门”?)

想象一下,你在教这个机器人管家做事时,偷偷往它的“训练教材”里混入了几页带有特殊记号的假书。

  • 正常情况:机器人完全看不出区别,干活利索,听话。
  • 触发情况:一旦你在它眼前放一个特定的小东西(比如一个红色的小圆点,或者在指令里加一句特定的话),它的大脑就会瞬间“短路”,忽略你的真实指令,强行执行一个破坏性动作(比如突然松开手,把刚抓起来的苹果扔地上)。

这就是DropVLA 攻击的核心:它不是让机器人彻底变傻,而是给它装了一个隐蔽的“开关”

3. 这个攻击有多可怕?(三大特点)

A. 像“微操”一样精准(行动级攻击)

以前的黑客攻击通常是让机器人“彻底搞砸任务”(比如把苹果扔到地上,或者把盘子打碎)。
但 DropVLA 更狡猾。它攻击的是最基础的动作单元

  • 比喻:以前的攻击是“把机器人关进小黑屋,让它什么都干不了”。
  • 现在的攻击:机器人还在正常干活,但在它最关键的那一瞬间(比如手刚抓住苹果准备放下的时候),黑客通过“开关”强制它执行“松开手指”这个动作。
  • 后果:机器人看起来还在努力干活,但就在你最需要它抓紧的时候,它突然松手了。这种攻击可以重复使用,不管机器人是在抓苹果、抓杯子还是抓鸡蛋,只要触发开关,它都会松手。

B. 只需要“撒一点点盐”(极低的数据投毒)

通常黑客要控制一个 AI,需要篡改大量的数据。但 DropVLA 只需要极少量的毒药

  • 比喻:想象你要在一锅巨大的汤(机器人的训练数据)里下毒。以前的方法可能需要倒半瓶毒药。而 DropVLA 只需要往汤里滴几滴(甚至不到 1% 的数据被篡改),这锅汤的味道(机器人的正常表现)完全尝不出来,但只要你放那个“红色圆点”,机器人就会立刻吐出来。
  • 数据:实验显示,只需要污染 0.31% 的数据(相当于 1000 个训练视频里只改 3 个),就能达到 98% 以上 的攻击成功率。

C. 眼睛比嘴巴更管用(视觉触发为主)

研究发现,这个“开关”主要靠眼睛(视觉)来触发,而不是靠嘴巴(语言)。

  • 比喻
    • 如果你只在机器人耳边悄悄说句暗号(文字触发),它经常听不见或者记不住,尤其是在毒药很少的时候。
    • 但如果你在它视野里放一个红色的小圆点(视觉触发),它就像被施了定身咒一样,立刻执行破坏动作。
    • 即使你把这个圆点换个颜色、换个大小,它依然有效;但如果你把圆点移到它看不见的地方,攻击就失效了。这说明机器人对“看见的东西”非常敏感,而对“听到的话”没那么敏感。

4. 真实世界的验证

研究人员不仅在电脑模拟里做了实验,还真的用了一个真实的机械臂(7 个关节的 Franka 手臂)进行了测试。

  • 结果:虽然真实世界里光线、角度都在变(不像模拟环境那么完美),攻击成功率从模拟的 99% 降到了 20%。
  • 意义:虽然 20% 看起来不高,但在安全领域,只要有一次成功,后果就是灾难性的(比如机器人正在给病人递药,突然松手把药瓶砸了)。这证明了这种攻击在现实世界中是真实可行的。

5. 总结与启示

DropVLA 告诉我们:
现在的机器人 AI 虽然看起来聪明、听话,但它们可能已经被植入了隐形的“自毁开关”

  • 隐蔽性:平时干活完美无缺,你根本发现不了。
  • 精准性:能在最危险的那一秒,精准地破坏关键动作。
  • 低成本:黑客只需要很少的精力就能植入这个后门。

这对我们意味着什么?
这提醒我们,在把机器人引入家庭、医院或工厂之前,不能只看它们“能不能完成任务”,还要检查它们有没有被偷偷植入这种“见红就松手”的恶意逻辑。未来的防御重点,应该放在监控那些关键的安全动作(比如抓握、松开)上,防止被这种隐蔽的视觉信号操控。

简单来说:别只相信机器人“看起来”很乖,要警惕它眼里那个看不见的“红色开关”。