Openfly: A comprehensive platform for aerial vision-language navigation

이 논문은 실외 항공 시야에서의 시각 - 언어 항법 (VLN) 을 위한 대규모 벤치마크, 자동화 데이터 수집 도구체인, 그리고 3D 가우시안 스플래팅을 활용한 고품질 시뮬레이션 환경을 포함한 포괄적인 플랫폼 'OpenFly'와 이를 기반으로 한 에이전트를 제안합니다.

Yunpeng Gao, Chenhui Li, Zhongrui You, Junli Liu, Zhen Li, Pengan Chen, Qizhi Chen, Zhonghan Tang, Liansheng Wang, Penghui Yang, Yiwen Tang, Yuhang Tang, Shuai Liang, Songyi Zhu, Ziqin Xiong, Yifei Su, Xinyi Ye, Jianan Li, Yan Ding, Dong Wang, Xuelong Li, Zhigang Wang, Bin Zhao

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 왜 이 프로젝트가 필요했을까요? (문제점)

지금까지 드론이 "저기 빨간 지붕 있는 건물로 가라"는 말을 듣고 날아가는 법을 배우려면, 사람이 직접 드론을 조종해서 경로를 만들고, 그걸 기록한 뒤 사람이 일일이 "여기서 왼쪽으로 돌아라"라고 설명을 적어줘야 했습니다.

  • 비유: 마치 아이가 자전거를 타는 법을 배울 때, 부모님이 일일이 "발 페달을 3 번, 핸들을 30 도 돌려라"라고 종이에 적어주며 가르치는 것과 같습니다.
  • 문제: 이 과정이 너무 시간이 걸리고, 비용이 많이 들며, 데이터 양도 적었습니다. 그래서 드론이 똑똑해지기가 어려웠죠.

2. OpenFly 가 해결한 3 가지 핵심 비법

OpenFly 는 이 문제를 해결하기 위해 세 가지 마법 같은 도구를 만들었습니다.

① 다양한 '가상 현실' 놀이터 (렌더링 엔진 통합)

기존에는 드론 훈련용 가상 세계가 딱 하나나 둘 정도였는데, OpenFly 는 4 가지 다른 세계를 하나로 합쳤습니다.

  • 비유: 드론 훈련을 시키기 위해 '실제 도시', '영화 속 도시', '게임 속 도시', 그리고 실제 드론이 찍은 사진을 3D 로 재구성한 진짜 같은 도시까지 모두 섞어놓은 거대한 놀이터를 만든 것입니다.
  • 효과: 드론이 다양한 날씨, 건물 스타일, 조명 조건을 경험하며 훨씬 똑똑해집니다. 특히 '3D 가우스 스플래팅' 기술을 써서 실제 드론이 찍은 사진을 가상 세계로 완벽하게 옮겨와, 가상과 현실의 경계를 없앴습니다.

② 자동화 공장 (데이터 생성 툴체인)

사람이 일일이 드론을 조종하고 설명을 적는 대신, 컴퓨터가 알아서 모든 일을 하게 했습니다.

  • 비유: 드론 훈련용 '교과서'를 만드는 공장을 지은 것입니다.
    1. 먼저 3D 지도를 스캔합니다.
    2. 건물을 자동으로 찾아내어 '목표물'로 지정합니다.
    3. 드론이 벽에 부딪히지 않고 날 수 있는 길을 자동으로 찾습니다.
    4. 마지막으로 AI(거대 언어 모델) 가 그 경로를 보고 "저기 빨간 지붕 건물로 가라" 같은 자연스러운 지시문을 자동으로 작성합니다.
  • 결과: 사람이 일일이 할 수 없었던 10 만 개 (100K) 의 드론 비행 데이터를 단기간에 만들어냈습니다.

③ 새로운 드론 조종사 AI (OpenFly-Agent)

만든 데이터를 바탕으로 드론을 조종하는 새로운 AI 모델을 개발했습니다.

  • 핵심 기술: 드론이 날 때 모든 장면을 다 기억하면 머리가 터집니다. OpenFly-Agent 는 중요한 순간 (랜드마크가 보일 때) 만 집중하고, 그 외의 지루한 구간은 요약해서 기억합니다.
  • 비유: 길을 찾을 때 "길가 모든 가게를 다 기억할 필요는 없고, '빨간 간판'이나 '큰 은행' 같은 랜드마크만 기억하면 된다"는 전략을 쓴 것입니다. 덕분에 계산 속도도 빨라지고 정확도도 높아졌습니다.

3. 어떤 성과를 냈나요?

  • 데이터 규모: 기존 드론 데이터셋보다 10 배 이상 큰 10 만 개의 비행 경로를 확보했습니다.
  • 성능: 이 새로운 AI 모델을 테스트했을 때, 기존 방법들보다 성공률이 14%~7.9% 더 높았습니다.
  • 실제 적용: 컴퓨터 시뮬레이션뿐만 아니라, 실제 드론을 가지고 실험했을 때도 다른 방법들보다 훨씬 잘 날아다녔습니다.

4. 요약: 이 논문이 우리에게 주는 메시지

OpenFly 는 **"드론이 하늘을 자유롭게 날아다니게 하려면, 사람이 일일이 가르칠 게 아니라 AI 가 스스로 다양한 가상 세계를 경험하고 학습할 수 있도록 환경을 만들어주는 게 중요하다"**는 것을 증명했습니다.

이제 드론은 구조대원이 되어 재난 지역을 수색하거나, 배송 기사가 되어 물건을 나르는 등 더 복잡하고 중요한 임무를 수행할 수 있는 기반을 마련하게 되었습니다. 연구진은 이 플랫폼과 데이터를 모두 공개하여, 전 세계의 연구자들이 함께 드론 기술을 발전시킬 수 있도록 했습니다.