Bi-AQUA: Bilateral Control-Based Imitation Learning for Underwater Robot Arms via Lighting-Aware Action Chunking with Transformers

本文提出了 Bi-AQUA,这是首个将显式光照建模与基于 Transformer 的双边动作分块相结合的水下机器人臂模仿学习框架,通过层级化光照感知设计有效克服了水下光照变化与能见度降低的挑战,并在真实世界的接触式操作任务中展现出优于传统方法的鲁棒性。

Takeru Tsunoori, Masato Kobayashi, Yuki Uranishi

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 Bi-AQUA 的新技术,它让水下机器人的机械臂变得更聪明、更灵活,就像给机器人装上了一副“超级眼镜”和一双“有感觉的手”。

为了让你轻松理解,我们可以把这项技术想象成教一个潜水员在浑浊、光线变幻莫测的海底干活

1. 核心难题:海底的“视觉迷宫”

想象一下,你戴着潜水镜在水下工作。

  • 光线乱变:阳光穿过水面会散射,水里的颜色会失真(比如红色光传不远,看起来全是蓝的),甚至会有气泡或浑浊物挡住视线。
  • 传统机器人的困境:普通的机器人就像是一个只靠眼睛看的盲人。如果光线变了,它看到的物体颜色、形状全变了,它就会“晕头转向”,不知道手该往哪伸,或者用力多大。它要么抓不住东西,要么把东西弄坏。

2. Bi-AQUA 的三大绝招

为了解决这个问题,研究团队给机器人设计了一套“三位一体”的超级系统:

第一招:给机器人装个“光线翻译官” (Lighting Encoder)

  • 比喻:就像你戴了一副智能眼镜,这副眼镜不仅能看东西,还能实时分析周围的光线环境
  • 作用:不管水底是红色的、蓝色的,还是忽明忽暗的,这个“翻译官”能立刻告诉大脑:“嘿,现在光线偏红,物体看起来有点暗,我们要调整一下判断。”它不需要人工教它什么是红光什么是蓝光,它是自己从画面里“悟”出来的。

第二招:给大脑装个“动态滤镜” (FiLM Modulation)

  • 比喻:想象你在看手机照片,光线不好时,你会用滤镜把照片调亮、调准颜色。Bi-AQUA 给机器人的视觉系统装了一个自动调节的滤镜
  • 作用:当“光线翻译官”发现环境变了,它立刻指挥这个滤镜:“现在光线太蓝了,把视觉信号里的蓝色调少一点,把红色补回来。”这样,无论水底光线怎么变,机器人看到的物体原本的样子(比如那个红色的积木)始终清晰可见。

第三招:给大脑装个“光线记忆条” (Lighting Token)

  • 比喻:这就像在机器人的“操作说明书”里,专门加了一行关于当前光线的备注
  • 作用:当机器人决定下一步动作时,它不仅看物体,还会看一眼这个“备注”:“哦,现在是动态变化的光线,动作要更谨慎一点。”这让机器人能根据光线情况,灵活调整自己的动作计划。

3. 为什么还要用“双边控制”?(Bilateral Control)

除了眼睛(视觉),Bi-AQUA 还有一个关键特点:它有一双“有感觉的手”

  • 比喻:普通的机器人是“单线联系”,只有大脑发指令,手去执行。如果手碰到了东西,它感觉不到,容易用力过猛把东西捏碎。
  • Bi-AQUA 的做法:它像两个人配合(一个在水面上操作,一个在水下执行)。水面上的人能感觉到水下机械臂碰到了什么阻力,并把这些“触感”实时反馈给操作者。
  • 结果:这让机器人拥有了触觉。在抓一个滑溜溜的、或者需要轻轻拔出来的东西(比如拔钉子)时,它能像人一样“感觉”到阻力,从而调整力度,不会硬来。

4. 实验效果:它有多强?

研究人员在真实的水箱里做了很多测试,比如:

  • 搬运积木:在红光、蓝光、甚至光线不断闪烁变化的环境下,其他机器人早就抓瞎了,Bi-AQUA 依然能稳稳地把东西从 A 点搬到 B 点。
  • 关抽屉:这是一个需要长时间、多步骤的任务。Bi-AQUA 能像人一样,先拿东西,再慢慢把抽屉推上,即使光线变了也不出错。
  • 拔钉子:这是最难的任务,需要非常精细的触觉和视觉配合。没有“有感觉的手”的机器人根本拔不出来,但 Bi-AQUA 成功率极高。

总结

简单来说,Bi-AQUA 就是给水下机器人做了一次“超级升级”:

  1. 眼睛更亮:能自动适应水下千变万化的光线,不再被颜色欺骗。
  2. 手感更好:能像人一样通过触觉感知阻力,动作更精准。
  3. 脑子更活:把光线信息和触觉信息结合起来,让它能在复杂的水下环境中,像熟练的潜水员一样自如地工作。

这项技术让水下机器人不再只是“瞎子”或“莽夫”,而是变成了能真正帮人类在海底干活的智能助手