A Champion-level Vision-based Reinforcement Learning Agent for Competitive Racing in Gran Turismo 7

この論文は、Gran Turismo 7 において、外部の位置特定装置を必要とせず自車搭載のカメラとセンサーデータのみを用いて学習した非対称な強化学習エージェントが、ゲーム内標準ドライバーを凌駕するチャンピオン級のレーシング性能を初めて実証したことを報告しています。

Hojoon Lee, Takuma Seno, Jun Jet Tai, Kaushik Subramanian, Kenta Kawamoto, Peter Stone, Peter R. Wurman

公開日 2026-03-10
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

人工知能が「グランツーリスモ 7」で世界チャンピオンに!

~「目」だけで走る、超高速レーシング AI の物語~

この論文は、ゲーム『グランツーリスモ 7(GT7)』の中で、「カメラの映像と車の感覚」だけを使って、人間チャンピオンをも凌駕するレーシング AIを開発したという驚くべき成果を報告しています。

これまでの AI は、レーシングカーの位置や他の車の場所を「神の視点(GPS のようなもの)」で知っていたため、現実世界では使えないという弱点がありました。しかし、この新しい AI は、ドライバーが実際に見ている風景と、ハンドルやアクセルの感覚だけで、見えない先の状況まで見通して走ります。

まるで、**「暗闇で走っているかのように、過去の記憶と現在の視覚だけで、未来を予測しながら走る天才ドライバー」**のような存在です。


🏎️ 従来の AI との違い:GPS あり vs ありえない「目」だけ

  • 従来の AI(GPS 依存型):
    まるで「頭の中に精密な地図と、他の車の位置がリアルタイムで表示されるナビゲーター」が乗っている状態です。ゲーム内では最強ですが、現実世界にそんなナビゲーターは存在しません。

  • 今回の AI(ビジョンベース型):
    「目」と「体感」だけです。

    • 目(カメラ): 前方の景色、他の車の動き、道路の端。
    • 体感(センサー): 車のスピード、加速、ハンドルを切った角度。

    これだけしか情報がないのに、**「あ、あの車の後ろに隠れている車が、今から追い抜いてくるな」とか「曲がり角の向こうに壁があるから、少しブレーキを踏もう」**と、見えない部分まで推理して行動します。

🧠 脳の仕組み:「経験談」を話す二人組

この AI は、**「経験豊富な監督(クリティック)」「現場の選手(アクター)」**という二人組で構成されています。

  1. 選手(アクター):

    • 役割: 実際の運転を担当。
    • 制限: 現場(ゲーム画面)の情報と、自分の体感しか見られません。GPS は見せられません。
    • 武器: **RNN(再帰型ニューラルネットワーク)**という「強力な記憶力」。
      • これにより、一瞬前に見えた景色や、数秒前の車の動きを「記憶」し、現在の判断に活かします。まるで**「過去のレース映像を頭の中で再生しながら、次の一手を決める」**ような感覚です。
  2. 監督(クリティック):

    • 役割: 選手の動きを評価し、指導する。
    • 特権: 練習中は「神の視点(GPS や全車の位置)」をすべて見ることができます。
    • 仕組み: 選手が「目だけ」で判断している間に、監督は「全情報」を使って「あの判断は正しかったか?もっと良い方法があったはずだ」と教えます。
    • 結果: 選手は監督の指導を浴びて、**「目だけ」でも「全情報がある時と同じくらい上手に」**運転できるようになります。

これを**「非対称なアクター・クリティック」**と呼びます。練習中は先生が全て知っていますが、本番(試合)では生徒が自力で戦うのです。

🏁 驚異的な実力:最後尾から優勝まで

この AI を「東京・エクスプレスウェイ」「スパ・フランコルシャン」「ル・マン」という 3 つの過酷なコースでテストしました。

  • スタート: 20 台のレースで、**最後尾(20 番手)**からスタート。
  • 相手: 19 台のゲーム内 AI(BIAI)と、人間のプロドライバー。
  • 結果:
    • ほぼ毎回優勝しました。
    • 人間のプロチャンピオンよりも、**「ゴールまでの差(勝ち幅)」**が広かったのです。
    • 特に「東京」のような狭いコースでは、他の車の動きを完璧に読み取り、隙間を縫うように追い抜く様子が描かれています。

🔍 目で見ているものは?(AI の思考プロセス)

研究チームは、AI が「どこを見て判断しているか」を可視化しました。

  • 追い抜き時: 人間のドライバーと同じく、**「前の車のタイヤの影」「車の下部」**に注目し、隙間があるか判断しています。
  • 直線時: **「遠くの地平線」「木々のライン」**を見て、次のカーブを予測しています。
  • 記憶の力: 現在のフレームだけでなく、**「数秒前のフレーム」**の情報も使って、「あの車は右に振ったから、次は左に寄ってくるはずだ」と予測しています。

🛡️ 失敗しないための工夫

AI が特定のコースや景色に「慣れすぎて(過学習)」失敗しないよう、2 つの工夫を施しました。

  1. 画像の揺らし(データ拡張):
    練習中に、あえて画像を少しずらしたり、色を変えたりします。まるで**「天候が変わったり、カメラが少し揺れたりする状況」**を想定して、どんな状況でも対応できるように鍛え上げるのです。
  2. 脳のリセット(ネットワーク再初期化):
    練習の途中、一度 AI の記憶をリセットします。これにより、「最初の単純な練習で身につけた悪い癖」を捨て去り、より複雑で高度な戦術を学び直すきっかけを作ります。

🌟 まとめ:現実世界への第一歩

この研究は、**「カメラとセンサーだけ」**で、人間を超えたレーシング AI を作れることを証明しました。

  • ゲーム内では: すでに世界チャンピオンレベル。
  • 現実世界では: まだテスト段階ですが、GPS が使えない場所(トンネルや都会のビル街)でも、**「目と感覚」**だけで自動運転車を走らせる可能性を大きく広げました。

まるで、**「地図もナビも持たず、ただ目の前の風景と車の振動だけで、世界一速く走るドライバー」**が誕生した瞬間です。今後の自動運転技術の発展に、大きな希望を与える成果と言えるでしょう。