DriveCode: Domain Specific Numerical Encoding for LLM-Based Autonomous Driving

이 논문은 자율주행에서 LLM 의 정밀한 수치 추론과 제어 명령 생성의 한계를 극복하기 위해, 숫자를 토큰이 아닌 전용 임베딩으로 매핑하는 새로운 인코딩 방식인 DriveCode 를 제안하고 그 유효성을 입증합니다.

Zhiye Wang, Yanbo Jiang, Rui Zhou, Bo Zhang, Fang Zhang, Zhenhua Xu, Yaqin Zhang, Jianqiang Wang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🚗 드라이브코드 (DriveCode): 자율주행 AI 가 숫자를 '느끼는' 법

이 논문은 자율주행 자동차를 위한 인공지능 (AI) 을 더 똑똑하고 정확하게 만드는 새로운 기술인 **'드라이브코드 (DriveCode)'**를 소개합니다.

기존의 AI 는 숫자를 읽을 때 마치 우리가 책을 읽듯이 **문자 (토큰)**로 하나씩 쪼개서 봅니다. 예를 들어 "3.14"라는 숫자를 보려면 AI 는 "3", ".", "1", "4"라는 네 개의 글자를 순서대로 읽어야 합니다. 하지만 이 방식은 자율주행처럼 정밀한 숫자 계산이 중요한 분야에서는 큰 약점이 됩니다.

🧩 비유 1: 레고 블록 vs. 점토

기존의 AI 방식은 레고 블록을 쌓는 것과 같습니다.

  • 숫자 "3.14"를 만들려면 "3" 블록, "." 블록, "1" 블록, "4" 블록을 하나씩 붙여야 합니다.
  • 문제는 AI 가 이 블록들을 붙일 때, "3"과 "4"가 붙으면 3.14 가 되는 것이 아니라, 단순히 글자 나열로 인식할 수 있다는 점입니다. "3.11"이 "3.8"보다 큰지 작은지 헷갈릴 수도 있습니다.

드라이브코드는 이 방식을 점토로 바꿉니다.

  • 숫자를 글자 조각으로 자르지 않고, **그 자체로 하나의 연속된 덩어리 (벡터)**로 AI 의 뇌에 직접 넣습니다.
  • 마치 숫자를 글자로 읽는 것이 아니라, 숫자의 '크기'와 '의미'를 AI 가 직접 느끼게 만드는 것과 같습니다.

🛠️ 어떻게 작동할까요? (두 가지 핵심 도구)

드라이브코드는 AI 에게 두 가지 새로운 장비를 달아줍니다.

  1. 숫자 투사기 (Number Projector): "입구"

    • 카메라로 본 영상과 운전자의 지시 (텍스트) 는 그대로 받지만, 숫자가 나오면 이를 특수한 숫자 언어로 변환해서 AI 의 뇌에 넣습니다.
    • 예: "속도가 50km/h 입니다"라는 문장에서 '50'이라는 숫자는 AI 가 이해할 수 있는 숫자 전용 신호로 바뀝니다.
  2. 숫자 머리 (Number Head): "출구"

    • AI 가 답을 낼 때, 글자를 하나씩 타이핑하듯 숫자를 쪼개서 말하지 않습니다.
    • 대신 한 번에 숫자 전체를 뿜어냅니다. "속도 50"이라고 말할 때, "5", "0"을 따로 찍지 않고 50이라는 값을 바로 출력합니다.

🚦 왜 이것이 중요한가요?

자율주행에서는 0.1 의 오차도 치명적일 수 있습니다.

  • 기존 방식: AI 가 "속도 3.11"이라고 말했는데, 실제로는 "3.8"보다 작다고 잘못 판단해서 급정거를 하거나, 반대로 너무 빠르게 달려서 사고가 날 수 있습니다.
  • 드라이브코드 방식: AI 가 숫자의 '크기'를 정확히 이해하므로, "3.11 은 3.8 보다 작다"는 것을 글자 비교가 아닌 수학적 의미로 정확히 파악합니다.

🏆 실험 결과: 더 빠르고, 더 정확함

이론만 좋은 게 아닙니다. 연구진은 실제 자율주행 데이터 (DriveGPT4, OmniDrive 등) 로 실험해 보았습니다.

  • 정확도: 차의 진행 경로 (트랙) 를 예측하거나 핸들 각도, 속도를 조절할 때 기존 방법보다 오차가 훨씬 적었습니다.
  • 속도: 숫자를 글자 하나하나 만들어 내지 않고, 한 번에 숫자 값을 출력하므로 계산 속도가 더 빨라졌습니다. 자율주행처럼 실시간으로 반응해야 하는 상황에서는 이 '속도'가 생명을 구합니다.

💡 요약

드라이브코드는 자율주행 AI 에게 "숫자를 글자로 읽지 말고, 숫자 그 자체로 이해하라"고 가르친 기술입니다.

한 줄 평:
"기존 AI 가 숫자를 '문자'로 읽느라 헷갈렸다면, 드라이브코드는 AI 에게 숫자를 '직관'으로 느끼게 해줘서, 차를 더 안전하게, 더 똑똑하게 운전하게 만들었습니다."

이 기술이 상용화되면, 우리 모두 더 안전하고 부드러운 자율주행 경험을 할 수 있게 될 것입니다.