Learning Robust Control Policies for Inverted Pose on Miniature Blimp Robots

本文提出了一种包含高保真仿真校准、改进的 TD3 算法结合域随机化训练以及映射层设计的三阶段框架,成功实现了微型飞艇机器人在真实世界中的鲁棒倒置姿态控制。

Yuanlin Yang, Lin Hong, Fumin Zhang

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常酷的挑战:如何让一种像“小飞艇”一样的微型机器人,不仅能正常飞,还能头朝下、脚朝上地倒着飞,并且稳稳地停在那个姿势。

想象一下,普通的无人机像直升机,靠螺旋桨疯狂旋转产生升力,一旦倒过来,螺旋桨就推不动了,直接掉下来。但**微型飞艇(MBR)**不一样,它肚子里充满了氦气,像气球一样自带浮力。这让它很轻,但也让它很“飘”,控制起来非常难,尤其是倒立的时候。

为了教会这个“小飞艇”倒立,作者们用了一套**“模拟训练 + 随机挑战 + 现实微调”的聪明办法。我们可以把它想象成教一只杂技猫**学会倒立走钢丝:

1. 搭建一个“虚拟游乐场” (3D 仿真环境)

首先,作者们在电脑里建了一个极其逼真的虚拟世界(Unity 引擎)。

  • 比喻:就像在电脑游戏里造了一个完美的“训练场”。在这个场子里,飞艇的物理特性(比如空气阻力、浮力、重量分布)都被精确地模拟出来了。
  • 为什么需要它?:在现实世界里直接让飞艇倒立,它可能会摔得粉碎。在虚拟世界里,就算摔了一万次,也只需要重启一下,成本为零。

2. 让“杂技猫”面对千变万化的挑战 (域随机化)

这是最关键的一步。如果只在一个固定的环境下训练,飞艇学会的只是“死记硬背”,一旦现实中有风或者重量稍微变一点,它就懵了。

  • 比喻:作者们没有只让猫在一个固定的房间里练习。他们给训练场加了“随机性”:
    • 有时候把猫肚子里的氦气稍微多充一点,少充一点(改变浮力)。
    • 有时候把猫身上的小零件(比如电池)的位置挪一挪(改变重心)。
    • 有时候让它的马达力气大一点,小一点。
  • 目的:这就好比让猫在大风天、小雨天、负重不同、甚至重心偏移的各种极端情况下练习倒立。经过这种“地狱级”的随机训练,飞艇就练就了一身**“随机应变”的绝活**,不管现实世界怎么变,它都能稳住。

3. 用“超级教练”来指导 (改进的 TD3 算法)

他们使用了一种叫 TD3 的深度学习算法作为“超级教练”。

  • 比喻:这个教练非常聪明,它不像传统教练那样死板地计算公式(传统方法就像用数学公式硬算怎么倒立,稍微有点误差就算不出来)。这个教练是通过**“试错”**来学习的:
    • 飞艇试了一个动作,倒了,教练就扣分。
    • 飞艇试了一个动作,稳住了,教练就奖励。
    • 为了学得更快更稳,教练还用了**“多缓冲区”(把不同难度的训练记录分开存)和“梯度裁剪”**(防止学习过程中动作变形太大)。
  • 结果:经过成千上万次的虚拟试错,飞艇终于学会了一套**“肌肉记忆”**,知道在什么情况下该推哪个马达,才能稳稳倒立。

4. 从“虚拟”到“现实”的“翻译官” (Sim-to-Real 映射层)

这是最难的一步。电脑里的物理世界和真实世界总有细微差别(比如电脑里空气阻力算得准,但现实里有微风)。

  • 比喻:就像你学会了在模拟器里开车,但真车开起来手感不一样。作者设计了一个**“翻译层”**。
    • 当虚拟训练好的“大脑”发出指令时,这个“翻译官”会根据现实情况,稍微调整一下指令的力度(比如把推力稍微放大或缩小一点)。
    • 这就好比给飞艇戴了一副**“智能眼镜”**,让它能自动适应现实世界的“水土不服”,而不需要重新训练。

实验结果:真的成功了!

作者们把这套方法用在了真实的微型飞艇上:

  • 对比传统方法:传统的控制方法(像用公式硬算)就像是一个**“死脑筋”**,只有在参数完全匹配时才能倒立,稍微有点风吹草动或者重量变化,就失败了。
  • 他们的成果:这个**“经过随机训练的智能飞艇”**,不管电池重了还是轻了,不管马达力气大还是小,甚至不管重心怎么变,它都能成功倒立并稳稳停住。甚至在真实实验中,它还能在倒立状态下保持平衡。

总结

简单来说,这篇论文就是教一个**“娇气”的微型飞艇**,通过在虚拟世界里经历各种“变态”的随机训练,练就了一身**“金刚不坏”的倒立本领**,最后再通过一个**“智能翻译”**,让它把这份本领完美地展示在现实世界中。

这就像让一个杂技演员在各种狂风暴雨、负重变化的极端环境下练成了倒立,结果上台表演时,无论舞台怎么晃,他都能稳稳当当,令人惊叹。