A Champion-level Vision-based Reinforcement Learning Agent for Competitive Racing in Gran Turismo 7

이 논문은 Gran Turismo 7 에서 외부 위치 추적 없이 차량의 전방 카메라와 온보드 센서 데이터만을 활용하여 챔피언급 수준의 경쟁력을 갖춘 최초의 비전 기반 강화 학습 레이싱 에이전트를 제안합니다.

Hojoon Lee, Takuma Seno, Jun Jet Tai, Kaushik Subramanian, Kenta Kawamoto, Peter Stone, Peter R. Wurman

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏎️ 핵심 아이디어: "눈만 믿고 달리는 천재 드라이버"

기존의 레이싱 AI 들은 마치 비행기 조종사처럼 달렸습니다.

  • 기존 방식: 조종사는 비행기 밖의 모든 것을 정확히 알고 있습니다. "저기 100m 앞에 적군이 있고, 내 위치는 여기다"라고 전체 지도와 GPS를 통해 완벽하게 파악하죠. 하지만 현실 세계 (실제 도로) 에서는 이렇게 정확한 GPS 나 지도를 실시간으로 얻기 어렵습니다.

  • 이 연구의 방식: 이 연구의 AI 는 인간 드라이버처럼 달립니다.

    • 카메라 (눈): 차 앞유리에 달린 카메라로 앞만 봅니다.
    • 센서 (몸의 감각): 핸들링, 가속, 브레이크, 차의 흔들림 등을 직접 느끼는 센서만 사용합니다.
    • 특징: "내 위치가 어디지?", "저기 저 차가 어디 있지?"라는 전체 지도나 GPS 정보는 전혀 보지 않습니다. 오직 눈앞의 화면과 차의 느낌만으로 모든 결정을 내립니다.

🧠 어떻게 그렇게 똑똑해졌을까? (두뇌 구조)

이 AI 는 **비대칭 (Asymmetric)**이라는 독특한 두뇌 구조를 가졌습니다. 마치 수업 듣는 학생선생님의 관계와 비슷합니다.

  1. 학생 (Actor - 실행하는 부분):

    • 상황: 시험 시간 (실제 경기) 에는 오직 **눈앞의 화면 (카메라)**과 **손발의 느낌 (센서)**만 봅니다.
    • 역할: "저기 앞차가 보이네, 핸들을 살짝 돌려야겠다"라고 즉각적인 행동을 결정합니다.
    • 기억력: 이 학생은 단순한 기억이 아니라, 과거의 장면을 기억하는 **재귀 신경망 (RNN)**을 가지고 있습니다. "아, 3 초 전에 저기서 저 차가 지나갔으니, 지금 저기서 다시 나타날 거야!"라고 눈에 보이지 않는 적의 위치도 상상해냅니다.
  2. 선생님 (Critic - 평가하는 부분):

    • 상황: 수업 시간 (학습 중) 에는 전체 지도, 모든 차의 위치, 트랙의 끝까지 다 볼 수 있습니다.
    • 역할: 학생이 내린 결정이 맞는지 틀린지를 완벽한 정보를 바탕으로 평가하고 가르칩니다. "너는 저 차를 피해야 했는데, 왜 그쪽으로 갔니? 전체 지도를 보면 저기서 충돌할 거야."라고 알려줍니다.
    • 결과: 학습이 끝난 후, 학생은 선생님 없이도 (지도 없이) 혼자서도 챔피언급 실력을 발휘하게 됩니다.

🏆 결과는 어땠나요?

이 AI 는 게임 '그란 투라모 7'에서 19 명의 AI 적과 20 대의 레이싱을 펼쳤습니다.

  • 시작: 맨 마지막 (20 위) 에서 출발했습니다.
  • 결과: 1 위로 finish 라인을 통과했습니다.
  • 비교: 게임에 내장된 기본 AI 는 물론이고, **실제 인간 챔피언 (세계 대회 우승자)**보다도 더 빠르고 정확하게 달렸습니다.

특히 도쿄 에クス프레스웨이 같은 좁고 복잡한 코스에서는, 적의 차가 어디를 보고 있는지, 어느 방향으로 움직일지 카메라 화면만 보고도 완벽하게 예측해서 추월하는 모습을 보였습니다.

🎨 AI 는 무엇을 보고 있을까요? (시각 분석)

연구진은 AI 가 무엇을 보고 결정을 내리는지 분석했습니다.

  • 경쟁자가 보일 때: AI 는 적의 바퀴 아래쪽이나 그림자에 집중합니다. 인간 드라이버가 "저 차가 지금 코너를 잘 돌고 있나?"를 판단할 때 차의 하단부를 보는 것과 똑같습니다.
  • 직진할 때: AI 는 하늘, 나무 줄기, 도로 끝에 집중합니다. 인간이 "어디로 가야 할지"를 판단할 때 먼 곳의 랜드마크를 보는 것과 같습니다.
  • 과거의 기억: AI 는 지난 1 초, 2 초 전의 화면까지 기억해서, 지금 보이지 않는 적의 위치를 추측합니다. 마치 "방금 저기서 차가 지나갔으니, 지금 저기서 튀어나올 거야"라고 예측하는 것입니다.

💡 왜 이 연구가 중요할까요?

지금까지의 AI 레이싱은 현실 세계에 적용하기 어려웠습니다. (GPS 나 정밀 지도가 없으면 작동하지 않았기 때문).
하지만 이 연구는 "카메라와 센서만 있으면, 지도 없이도" 인간보다 잘 달릴 수 있음을 증명했습니다.

이는 곧 실제 자율주행 자동차가 복잡한 도시에서, GPS 가 끊기거나 주변 차들이 가려져도 눈과 센서만으로 안전하게, 그리고 빠르게 달릴 수 있는 가능성을 보여준 것입니다.

📝 한 줄 요약

"지도나 GPS 없이, 오직 앞유리 카메라와 차의 느낌만으로 인간 챔피언보다 더 잘 달리는 AI 드라이버를 개발했다!"

이 기술은 언젠가 우리 도로에서, 비가 오거나 안개가 끼는 상황에서도 스스로 길을 찾아 달리는 진정한 자율주행차의 핵심 기술이 될 것입니다.