OnFly: Onboard Zero-Shot Aerial Vision-Language Navigation toward Safety and Efficiency

本論文は、不安定な意思決定や長期的な進捗監視の課題を解決し、安全性と効率性を両立させるために、共有知覚型デュアルエージェント構造、ハイブリッドメモリ、セマンティック幾何学的検証器、および後退地平線計画器を組み合わせた完全オンボードのゼロショット航空ビジョン・言語ナビゲーションフレームワーク「OnFly」を提案し、シミュレーションおよび実世界飛行でその有効性を実証しています。

Guiyong Zheng, Yueting Ban, Mingjie Zhang, Juepeng Zheng, Boyu Zhou

公開日 2026-03-12
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

OnFly:ドローンが「目と耳」だけで空を飛ぶ新技術

この論文は、**「OnFly(オン・フライ)」**という新しいドローンの制御システムについて紹介しています。

一言で言うと、**「人間が『あの赤い花の隣にあるベンチまで飛んでね』と口頭で指示するだけで、ドローンが自分で考えて、安全に、かつ無駄なく目的地へたどり着く」**という技術です。

これまでの技術にはいくつかの悩みがありました。OnFly はそれらをすべて解決する「賢い操縦士」のような存在です。わかりやすく 3 つのポイントで解説します。


1. 「運転手」と「ナビゲーター」を分けた(二重の頭脳)

これまでのドローン AI は、「運転手」と「ナビゲーター」を一人の人間が同時にやろうとしていました。

  • 運転手: 今、ハンドルをどのくらい切るか?(1 秒間に何度も判断が必要)
  • ナビゲーター: 目的地に近づいたかな?迷子になっていないかな?(数秒に一度の判断でいい)

この 2 つを一人がやると、ナビゲーターが「ちょっと待って、地図を確認中!」と言っている間に、運転手がハンドルを切らされたり、逆に運転手が急いでいるのにナビゲーターが「あ、これ違うかも」と言い出して混乱したりします。

OnFly の解決策:
「運転手(決定エージェント)」と「ナビゲーター(監視エージェント)」を二人の別々の人間に分けました。

  • 運転手: 常に前を見て、高速で「次はここへ飛べ!」と指示を出し続けます。
  • ナビゲーター: ゆっくりと「まだ目的地に着いていない?」「道に迷っていない?」を確認し、必要なら運転手に「止まれ!」と伝えます。

このように役割を分けることで、ドローンは**「止まらずにスムーズに飛び続けつつ、間違えたらすぐに修正する」**という、人間には難しいバランスを完璧に実現しています。

2. 「昔の思い出」と「今の景色」を上手に記憶する(ハイブリッドな記憶)

長い旅をするとき、人間は「出発した場所」や「重要な分かれ道」を覚えていますが、細かな「1 秒前の景色」はすぐに忘れてしまいます。
これまでの AI は、新しい写真が来るたびに古い写真を捨ててしまう(スライド窓)ため、「全体の流れ」を忘れやすく、迷子になりがちでした。

OnFly の解決策:
**「最初の写真(出発点)」+「重要な分かれ道の写真(キーフレーム)」+「今の写真」**をセットで記憶する「ハイブリッド記憶」を使います。

  • メリット: 全体の流れ(「あ、ここは 3 分前に通った道だ」)を忘れずに保ちつつ、最新の状況も把握できます。
  • 魔法: これにより、AI の脳みそ(メモリ)の再利用が効率化され、**「迷子にならず、かつ計算が速く」**行えるようになりました。

3. 「言葉の意図」と「物理的な壁」のチェック(安全確認)

AI が「あの木を目指して!」と言ったとき、AI は「木がある場所」は知っていますが、「その木まで飛ぶ途中に電柱や壁がないか」までは自動的には考えません。
また、言葉のニュアンス(「木の下」なのか「木のすぐ隣」なのか)を間違えることもあります。

OnFly の解決策:
AI が決めた目標地点に対して、「言葉のチェック」と「物理的なチェック」を 2 段階で行います。

  1. 言葉のチェック: 「本当に指示された場所(赤い花の隣)に行こうとしているか?」を確認。
  2. 物理的なチェック: 「その先に壁や電柱がないか?」を深度センサーで確認し、もし危険なら**「少し横にずらして、安全なルート」**を自動で計算します。

まるで**「運転手とナビゲーターが、出発前に『このルート、壁にぶつかりそうじゃない?』と確認し合い、安全な道だけを選んで進む」**ようなイメージです。


結果:どれくらいすごいのか?

このシステムをシミュレーション(仮想空間)と実際のドローンでテストした結果、驚異的な改善が見られました。

  • 成功率: 従来の最高技術でも 26% しか成功していませんでしたが、OnFly は**67.8%**まで劇的に向上しました。
  • 安全性: 衝突する回数が激減しました。
  • リアルタイム性: すべてをドローン自体(オンボード)で処理しており、クラウドに頼らず、遅延なく飛ぶことができます。

まとめ

OnFly は、**「運転手とナビゲーターを分ける」「賢い記憶術を使う」「言葉と物理的な安全をダブルチェックする」という 3 つの工夫によって、ドローンが複雑な環境でも、人間のように「安全に、かつ効率的に」**指示された場所へ飛べるようにした画期的な技術です。

今後は、災害現場での捜索や、都市部の配送など、より複雑で危険な場所でのドローン活用が現実味を帯びてくるでしょう。