ImagiDrive: A Unified Imagination-and-Planning Framework for Autonomous Driving

이 논문은 자율주행의 안전하고 정밀한 의사결정을 위해 비전 - 언어 모델과 주행 세계 모델을 통합하여 행동 예측과 미래 장면 생성을 상호 보완적으로 활용하는 'ImagiDrive'라는 새로운 프레임워크를 제안하고, nuScenes 및 NAVSIM 데이터셋을 통한 실험을 통해 기존 방법보다 우수한 성능을 입증합니다.

Jingyu Li, Bozhou Zhang, Xin Jin, Jiankang Deng, Xiatian Zhu, Li Zhang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🚗 상상하고 계획하는 자율주행차: 'ImagiDrive' 이야기

이 논문은 자율주행차가 더 안전하고 똑똑하게 운전할 수 있도록 돕는 새로운 기술, ImagiDrive(상상주행) 를 소개합니다. 기존 기술의 한계를 넘어서기 위해, '생각하는 AI(언어 모델)''미래를 보는 AI(세계 모델)' 를 하나로 합쳤습니다.

이 복잡한 기술을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 왜 새로운 기술이 필요할까요? (기존의 문제점)

지금까지의 자율주행 기술은 크게 두 가지 부류로 나뉩니다.

  • A형 (언어 기반 AI): "저기 빨간불이 켜졌으니 멈춰야지"라고 이해하고 이유를 설명할 줄 압니다. 하지만 미래의 상황을 구체적으로 '상상'하거나 예측하는 데는 약점이 있습니다.
  • B형 (세계 모델 AI): "차가 이렇게 움직이면 2 초 뒤엔 저기서 사고가 날 거야"라고 미래 장면을 그림으로 그려냅니다. 하지만 왜 그렇게 해야 하는지 논리적으로 설명하거나 복잡한 상황을 판단하는 데는 약점이 있습니다.

기존에는 이 두 가지가 따로 놀았습니다. 마치 논리만 뛰어난 운전교관그림만 잘 그리는 예지몽을 보는 사람이 따로 있는 것과 같습니다.

2. ImagiDrive 의 핵심 아이디어: "상상하고, 다시 생각하기"

ImagiDrive 는 이 두 사람을 한 팀으로 묶었습니다. 마치 스스로를 훈련시키는 마법 같은 운전 시스템처럼 작동합니다.

🔄 상상 - 계획 - 반복 루프 (Imagination-and-Planning Loop)

이 시스템은 다음과 같은 과정을 반복합니다:

  1. 초안 계획 (생각): 운전대 (VLM) 가 현재 상황을 보고 "일단 직진하자"라고 계획을 세웁니다.
  2. 미래 상상 (그림): 이 계획을 바탕으로, 미래 시나리오를 그리는 화가 (Scene Imaginer) 가 "그럼 2 초 뒤엔 차가 어떻게 될까?" 라는 장면을 그림으로 그려냅니다.
  3. 검토 및 수정 (다시 생각): 운전대는 그 그려진 미래 그림을 보고 다시 생각합니다. "아, 내가 직진하면 저기서 사고가 나겠구나! 그럼 속도를 줄여야겠다."
  4. 최종 결정: 이 과정을 몇 번 반복하다가 가장 안전하고 자연스러운 계획을 선택합니다.

💡 비유:
마치 체스를 두는 것과 같습니다.

  • 기존 방식: "이 수를 두면 좋겠다"라고 바로 둡니다.
  • ImagiDrive 방식: "이 수를 두면 상대방이 어떻게 반응할까?"라고 상상해 보고, 그 반응을 보고 다시 "아, 그럼 이 수를 두는 게 나을 것 같다"고 계획을 수정합니다.

3. 어떻게 속도와 안전을 잡았을까요? (두 가지 전략)

미래를 상상하고 계획을 수정하는 과정은 시간이 오래 걸릴 수 있습니다. 그래서 두 가지 똑똑한 장치를 달았습니다.

  • 🛑 조기 종료 전략 (Early Stopping):
    • "이미 충분히 생각했어!"라고 판단할 때 멈춥니다.
    • 비유: 길을 찾을 때, 지도를 10 번이나 다시 봐도 같은 길이 나온다면, 더 이상 보지 않고 바로 가듯이 불필요한 계산을 줄여 속도를 높였습니다.
  • 🎯 최적 경로 선택 전략 (Trajectory Selection):
    • 여러 번 상상해서 나온 여러 가지 경로 중, 가장 일관되고 안전한 길을 골라냅니다.
    • 비유: 친구 5 명과 여행 계획을 세울 때, 모두 다른 길을 제안하지만 그중에서 가장 논리적이고 안전한 길 하나를 골라 실행하는 것과 같습니다.

4. 실제 결과는 어떨까요?

이 기술을 실제 데이터 (nuScenes, NAVSIM 등) 로 테스트한 결과, 기존 기술들보다 사고율이 현저히 줄어들고, 복잡한 교차로나 급커브 같은 상황에서도 더 안전하게 운전하는 것을 확인했습니다.

  • ImagiDrive-A: 상상 없이 현재 상황만 보고 계획 (기본형).
  • ImagiDrive-S: 미래를 상상하고 계획을 수정 (고급형).
    • 결과: '상상'을 포함한 S 버전이 사고를 훨씬 더 잘 피했습니다.

5. 한 줄 요약

ImagiDrive는 자율주행차에게 "미래를 상상해 보고, 그 상상을 바탕으로 계획을 다시 짜는 능력" 을 심어준 것입니다.

"먼저 미래를 그려보고, 그 그림을 보고 다시 생각하라."
이 간단한 원리가 자율주행의 안전성을 한 단계 업그레이드했습니다.

이 기술이 상용화되면, 우리도 더 안전하고 똑똑한 자율주행차를 타고 여행을 갈 수 있게 될 것입니다! 🚗✨