Fly360: Omnidirectional Obstacle Avoidance within Drone View

本文针对无人机在运动方向与机头朝向不一致时缺乏全向感知能力的局限,提出了名为 Fly360 的两阶段感知决策框架,利用全景 RGB 观测生成深度图并配合固定随机偏航训练策略,实现了稳定且优于传统前视基线的 omnidirectional(全向)避障能力。

Xiangkai Zhang, Dizhe Zhang, WenZhuo Cao, Zhaoliang Wan, Yingjie Niu, Lu Qi, Xu Yang, Zhiyong Liu

发布于 2026-03-09
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 Fly360 的无人机避障系统。为了让你轻松理解,我们可以把无人机想象成一个**“在拥挤人群中跳舞的舞者”,而 Fly360 就是赋予这位舞者“上帝视角”“超能力”**的大脑。

以下是用通俗语言和生动比喻对这篇论文的解读:

1. 痛点:为什么现在的无人机容易“撞墙”?

想象一下,你蒙着眼睛,只透过一根吸管看世界(这就是传统无人机的单目/前视摄像头)。

  • 现状:现在的无人机就像只盯着正前方看的“近视眼”。如果它要一边飞一边保持机头朝向某个目标(比如拍电影),一旦有人从它背后侧面冲过来,它就完全看不见,只能直直地撞上去。
  • 问题:以前的避障方法要么太笨重(需要画地图,像老式扫地机器人),要么视野太窄(只能看前面)。当无人机的飞行方向和机头朝向不一致时(比如横着飞或倒着飞),它们就“瞎”了。

2. 解决方案:Fly360 的“全景眼”

Fly360 给无人机装上了一双360 度全景眼(就像 Insta360 那种全景相机)。

  • 比喻:这就好比舞者不再只盯着前方,而是戴上了一副**“全景护目镜”**,能同时看到前后左右上下所有方向的障碍物。
  • 核心功能:无论无人机怎么飞、机头朝哪,它都能瞬间感知周围 360 度的环境,并做出反应。

3. 它是如何工作的?(两步走策略)

Fly360 的工作流程像是一个**“先看图,后决策”**的聪明助手:

  • 第一步:看图(感知阶段)

    • 无人机拍下一张 360 度的全景照片。
    • 系统利用一个预训练好的模型,瞬间把这张照片变成一张**“深度地图”**(就像给照片涂上了颜色深浅,告诉你哪里是近处的墙,哪里是远处的树)。
    • 比喻:这就像把一张平面的照片,瞬间变成了立体的乐高积木图,让无人机知道哪里能走,哪里是悬崖。
  • 第二步:决策(大脑阶段)

    • 一个轻量级的小程序(策略网络)看着这张“深度地图”,结合无人机当前的速度,直接告诉电机:“向左躲一点”、“向上飞一点”。
    • 比喻:这就像一位经验丰富的老司机,看一眼路况,手和脚就自动配合打方向、踩油门,不需要先画一张复杂的地图再规划路线。

4. 独门秘籍:如何训练这个“大脑”?

这是论文最精彩的部分。如果直接教无人机在复杂环境里乱飞,它很容易学坏。作者想出了一个**“固定随机朝向”**的训练法:

  • 传统训练:让无人机一直朝前飞,障碍物也只从前面来。这样它学出来的经验是:“前面有东西就躲”。
  • Fly360 的训练
    • 在每次训练开始前,系统随机给无人机定一个**“死脑筋”的朝向**(比如强行让它机头朝北,或者朝东)。
    • 然后,障碍物从四面八方(前后左右)冲过来。
    • 比喻:这就像教一个舞者跳舞,你强制规定他**“不管音乐怎么变,你的脸必须一直盯着北边”,但你要让他学会“无论有人从哪个方向冲过来,你都能优雅地闪避”**。
    • 结果:通过这种“反直觉”的训练,无人机学会了**“不看机头朝向,只看周围空间”**的本能。无论它怎么转,它都知道怎么安全飞行。

5. 实际效果:有多牛?

论文在模拟器和真实世界中做了大量测试,对比了三种情况:

  1. 只看前面(传统方法):在复杂环境中几乎全灭,撞得惨不忍睹。
  2. 看多个摄像头拼接(多视角方法):虽然比只看前面好点,但因为画面拼接有缝隙,容易在边缘处“断片”,导致反应迟钝。
  3. Fly360(全景视角)
    • 悬停避障:在人群或障碍物中悬停,能像“太极推手”一样,灵活地推开周围的障碍,稳稳停住。
    • 动态跟随:即使有人追着无人机跑,或者无人机追着目标飞,它也能像“泥鳅”一样灵活穿梭,几乎不撞车。
    • 速度:反应极快,计算量小,能在无人机自带的芯片上实时运行。

总结

Fly360 就像是给无人机装上了**“全知全能的 360 度雷达眼”,并教会了它“不看脸,只看路”**的生存本能。

它不再需要笨重的地图构建,也不需要复杂的规划,而是像有经验的飞行员一样,凭借对周围环境的直觉感知,在拥挤、混乱甚至有人追逐的复杂环境中,实现丝滑、安全、全向的飞行。这对于未来的无人机航拍、搜救和物流配送来说,是一个巨大的飞跃。