Optimum control strategies for maximum thrust production in underwater undulatory swimming

本研究利用一种仿生机器人游泳器,结合机器学习与直觉模型来识别旨在最大化推力产生的最优控制策略,为实现自主水下运动提供了一种实用的、无模型的实现方案,从而架起了流体力学、机器人学与生物学之间的桥梁。

原作者: L. fu, S. Israilov, J. Sanchez Rodriguez, C. Brouzet, G. Allibert, C. Raufaste, M. Argentina

发布于 2026-01-26
📖 1 分钟阅读☕ 轻松阅读

原作者: L. fu, S. Israilov, J. Sanchez Rodriguez, C. Brouzet, G. Allibert, C. Raufaste, M. Argentina

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图推着一辆沉重的购物车穿过拥挤的超市。你可以轻轻地、平稳地推动它,也可以猛地用力推一下,等它减速,然后再猛推一下。这篇论文探讨了对于一只试图在水中游得尽可能快的机器人鱼来说,哪种方法才是最好的。

以下是他们发现的过程,通过简单的概念进行了拆解:

问题所在:如何像鱼一样游泳

真实的鱼、鲸鱼和蝌蚪通过身体前后摆动来游泳。这种动作会产生一个推向水的波浪,从而推动它们前进。科学家们长期以来一直在思考:什么样的“摆动”才是最完美的?

是一种平滑、温柔的波浪(如正弦波)?还是锯齿状的三角形波?或者是别的什么?为了找出答案,研究人员制造了一个机器人鱼,并让计算机学习最佳的运动方式。

实验过程:用“强化学习”教导机器人

团队制造了一个尾部由软塑料制成的柔性尾部的机器人鱼。他们安装了一个电机,可以通过拉动缆绳来弯曲尾部,就像真实的肌肉拉动骨骼一样。

研究人员并没有用特定的规则(比如“以 2 赫兹的速度摆动”)来编写程序,而是使用了强化学习(Reinforcement Learning)。这就像训练狗一样:

  • 机器人尝试不同的动作。
  • 每当它对水产生更强的推力(产生更多“推力/Thrust”)时,计算机就会给它一个“奖励”。
  • 每当它的运动效率低下时,它就得不到奖励。

随着时间的推移,计算机找到了能使奖励最大化的完美模式。

重大发现:“方波”

计算机发现的并不是一种平滑、温柔的波浪。相反,它发现最快的游泳方式是使用方波(Square Wave)

类比: 想象你在游乐场玩秋千。

  • 平滑的方式: 你以一种缓慢、有节奏的圆周运动,轻轻地前后推动秋千。
  • 方波的方式: 你使出浑身解数把秋千推到最向后,在那里停留一瞬间,然后立即使出全力把它推向最前方。你始终在“全速前进”和“全速后退”之间切换,没有中间状态。

机器人发现,通过在电机的两个极端限位(最大左转和最大右转)之间进行切换,可以产生最大的推力。这就像是一个“砰-砰”(Bang-Bang)控制器:你不是在“砰”(全功率),就是在“砰”(向另一个方向全功率)。不存在“也许”或“可能”。

为什么这有效?

研究人员建立了一个数学模型来理解其中的原理。他们发现有两个主要原因:

  1. 电机的限制: 机器人的电机有一个最大速度。如果你要求它平滑移动,它会花费大量时间在加速和减速上。通过在两个极端之间瞬间切换,电机几乎所有的时间都处于最高转速运行状态。
  2. 水的节奏: 水和尾部之间存在一种自然的“共振”(就像秋千有其自然节奏一样)。方波完美地契合了这种节奏,使尾部能够保持尽可能快的运动,而不会因为对抗水的阻力而浪费能量。

“摆动策略”:无需数学知识

研究人员意识到,要使用完美的方波,你通常需要精确知道机器人的重量、尾部的硬度以及电机的转速。而在现实世界中,这些很难被准确获知。

因此,他们发明了一个聪明的、“无模型”(Model-free)的小技巧,称之为**“摆动控制”(Swinging Control)**。

类比: 想象一个不懂物理的孩子在荡秋千。他并不会计算完美的推动时机。相反,他只是等待秋千在弧顶减速时,然后再推动。

  • 机器人也采取同样的做法。它观察尾部。
  • 只要尾部还在快速运动,它就保持电机向一个方向旋转。
  • 一旦尾部开始大幅减速,机器人会立即将电机切换到另一侧。

这种策略的效果几乎可以媲美完美的数学解,但它不需要任何关于机器人物理特性的先验知识。它只是对当下发生的情况做出反应。

最终证明

为了确保这不仅仅是针对特定机器人的偶然现象,他们在虚拟水箱中进行了一次大规模的计算机模拟,模拟一条鱼在水中游泳。他们测试了平滑波、锯齿波以及这种“切换”策略。

结果: “切换”策略(方波)始终让虚拟鱼比其他任何方法都游得更快。

总结

要在水下游得尽可能快,你不需要表现得平滑且温柔。你需要果断。在两个极端之间切换动力,并在你的速度开始下降的瞬间立即转换方向。这是一个简单而强大的规则,它架起了机器人运动方式与自然界游泳方式之间的桥梁。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →