Learning, locomotion, and navigation of soft synthetic snakes in three-dimensional, heterogeneous environments

本文提出了一种仿生强化学习框架,使软体合成蛇能够在简化地形中学习运动基元,并将其组合成自适应策略,以稳健地导航由真实世界数据重建的复杂、非均质三维环境。

原作者: Xiaotian Zhang, Ali Albazroun, Tixian Wang, Songyuan Cui, Prashant G. Mehta, Mattia Gazzola

发布于 2026-05-26
📖 1 分钟阅读☕ 轻松阅读

原作者: Xiaotian Zhang, Ali Albazroun, Tixian Wang, Songyuan Cui, Prashant G. Mehta, Mattia Gazzola

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,试图教一条机器蛇在布满岩石、沙土和凹凸不平的杂乱真实后院中蜿蜒穿行。现在,再想象一下,这条机器人并没有一个装满复杂数学方程的“大脑”来指挥每一块肌肉。相反,它拥有一种“智能本能”,使其能够在行进中自行摸索。

本文正是描述了这一点:一种通过结合仿生技巧与计算机学习,教导柔软无肢机器蛇如何在复杂三维环境中导航的新方法。

以下是他们如何做到的分解说明,使用了简单的类比:

1. 问题所在:肌肉太多,过于混乱

真正的蛇令人惊叹。它们能挤过裂缝、攀爬岩石,并在没有腿的情况下滑过沙地。但制造机器蛇很难,因为它的身体就像一根长长的、可弯曲的面条,拥有无限种弯曲方式。如果你试图用计算机控制这根面条的每一英寸,数学计算会变得如此复杂,以至于机器人会陷入停滞。

研究人员希望通过赋予机器人一个“简化的大脑”来解决这个问题,让它从经验中学习,而不是试图完美地计算每一个动作。

2. “肌肉记忆”技巧(驱动)

团队没有编程让机器人控制每一块肌肉,而是给它预设了一套舞蹈动作

  • 类比:将蛇的运动想象成沿着绳子传播的波浪。研究人员为机器人编程了一套简单的“双波”舞蹈:一个波浪左右移动(像蛇蜿蜒爬行),另一个波浪上下移动(抬起身体)。
  • 神奇之处:只需微调两个旋钮——蛇抬升的高度和波浪的时机——机器人就能改变其整体行为。它可以左转、右转、直行,甚至跳起“侧行舞”(像沙漠蛇一样横向移动)。这将一个复杂的问题变成了一个只需调整两个旋钮的简单游戏。

3. “第六感”(感知)

机器人需要知道它走在什么上面。是滑腻的沙地?还是粗糙的草地?

  • 类比:研究人员赋予机器人一种基于鱼群或鸟群协同移动方式的“感觉”系统。他们使用了一组虚拟的“振荡器”(像微小的同步节拍器),这些振荡器监听作用在蛇腹部的力。
  • 工作原理:当蛇碰到粗糙地面时,节拍器会同步起来,向大脑报告:“嘿,我们在崎岖的地形上!”当它碰到平滑的沙地时,它们的同步方式则不同。这让机器人无需昂贵的摄像头或激光,就能实时感知其环境。

4. 学习过程(强化学习)

团队没有为机器人编写操作手册。相反,他们让机器人通过试错来学习,就像小狗学习接飞盘一样。

  • 第一阶段:沙盒:首先,他们让蛇在平坦、简单的地板上练习(有些粗糙,有些平滑)。机器人尝试了数百万种不同的动作,接近目标会获得“积分”,陷入困境则会“扣分”。最终,它学会了两种完美的“舞步”:一种用于粗糙地面,一种用于平滑沙地。
  • 第二阶段:切换:然后,他们将机器人置于混合环境(一半粗糙,一半平滑)。他们没有重新训练整个机器人,而是给它定了一条简单的规则:“如果你的传感器感觉到粗糙,就使用粗糙地面的舞步;如果感觉到平滑,就使用平滑地面的舞步。”
  • 结果:机器人成功地在行进中切换舞步,像真正的蛇一样穿越了混合地形。

5. “抬头”超能力

最后,他们在真正杂乱的三维世界中测试了机器人,那里有山丘、裂缝和悬崖(根据火星和其他地形的真实照片重建)。

  • 挑战:有时,机器人会被困住,因为一个凸起抬起了它的腹部,导致它失去抓地力。
  • 解决方案:他们在机器人的大脑中增加了一个“紧急按钮”。如果传感器感觉到机器人正在失去与地面的接触,它会自动将头抬得更高
  • 类比:想象你在岩石小径上行走并差点绊倒;你会本能地抬脚更高以越过下一块岩石。机器人也是如此。通过抬头,它缩短了接触地面的身体部分,这实际上帮助它抓得更牢,转弯更急。

核心结论

研究人员构建了一个系统,使柔软的机器蛇能够:

  1. 学习在平坦地面上的简单运动模式。
  2. 感知它所在的地面类型,使用一种“集体感觉”系统。
  3. 切换不同的运动风格,当地面变化时瞬间完成。
  4. 适应,当地形变得崎岖时抬起头部。

结果是一个能够高可靠性地穿越复杂、真实世界三维景观的机器人,证明了要在杂乱的世界中移动,你并不需要超级复杂的大脑——你只需要正确的本能和一点点学习。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →