Word Recovery in Large Language Models Enables Character-Level Tokenization Robustness

이 논문은 기계적 해석을 통해 대형 언어 모델이 문자 단위 토큰화 입력에서도 견고한 성능을 보이는 핵심 메커니즘으로, 은닉 상태가 표준 단어 토큰을 재구성하는 '단어 복원 (word recovery)' 과정과 이를 가능하게 하는 초기 계층 내의 인접 문자 간 주의 메커니즘을 규명했다고 요약할 수 있습니다.

Zhipeng Yang, Shu Yang, Lijie Hu, Di Wang

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧩 핵심 비유: "레고 블록 vs. 흩어진 레고 조각"

일반적으로 AI 는 레고 세트 (단어 단위 토큰) 를 배우고 훈련합니다. 예를 들어, "사과"라는 단어를 하나의 레고 블록으로 인식하고 학습하죠.

하지만 연구자들은 AI 에게 "사", "과" 라는 두 개의 흩어진 레고 조각 (문자 단위) 만 주면서 "이게 뭐야?"라고 물었습니다. 이론적으로는 AI 가 당황해서 엉뚱한 답을 해야 할 것 같지만, 놀랍게도 AI 는 여전히 "사과" 라고 정확히 맞췄습니다.

이 논문은 "AI 가 어떻게 흩어진 조각을 다시 원래의 레고 블록 (단어) 으로 조립해내는가?" 그 비밀을 파헤쳤습니다.

🔍 발견된 비밀: "단어 복구 (Word Recovery)"

연구팀은 AI 의 뇌 (내부 작동 원리) 를 들여다보고 이 놀라운 능력을 '단어 복구 (Word Recovery)' 라는 이름으로 불렀습니다.

  1. 조립 과정 (단어 복구):
    AI 는 흩어진 알파벳 조각들을 받자마자, 바로 답을 내는 게 아니라 중간 단계에서 다시 단어를 조립합니다. 마치 흩어진 퍼즐 조각을 보고 "아, 이건 '사과'라는 그림이구나!"라고 머릿속에서 완성된 이미지를 다시 그려내는 과정입니다.

  2. 어떻게 조립할까? (그룹 내 주의):
    AI 는 조각들이 서로 어떻게 연결되는지 알아냅니다. 같은 단어에 속한 알파벳들 (예: 's', 'a', 'p', 'p', 'l', 'e') 은 서로 "우리끼리 모여서 정보를 주고받아!" 라고 신호를 보냅니다. 연구팀은 이를 '그룹 내 주의 (In-Group Attention)' 라고 부릅니다.

    • 비유: 마치 같은 팀의 선수들이 경기 시작 초기에 서로 눈빛을 교환하고 전략을 공유하는 것과 같습니다.

🧪 실험: "뇌 수술"을 해보았다

연구팀은 이 가설이 맞는지 확인하기 위해 AI 에게 '수술'을 했습니다.

  • 실험 1 (조립된 단어 지우기):
    AI 가 흩어진 조각을 다시 '사과'라는 단어로 조립해낸 순간, 그 정보를 AI 의 뇌에서 강제로 지워버렸습니다.

    • 결과: AI 는 갑자기 멍해졌고, 정답을 맞추는 능력이 급격히 떨어졌습니다.
    • 의미: AI 가 단순히 조각을 보고 추측한 게 아니라, 반드시 단어를 조립해내는 과정이 필요했다는 증거입니다.
  • 실험 2 (조각들 간의 대화 차단):
    흩어진 알파벳 조각들이 서로 정보를 주고받는 것 (그룹 내 주의) 을 초기 단계에서 차단했습니다.

    • 결과: AI 는 더 이상 단어를 조립할 수 없게 되었고, 성능이 무너졌습니다.
    • 의미: 초기 단계에서 조각들이 서로 대화하는 것이 단어를 복구하는 핵심 열쇠임을 증명했습니다.

💡 결론: 왜 이 연구가 중요할까요?

이 연구는 AI 가 단순히 입력된 문자를 기계적으로 처리하는 게 아니라, 스스로 의미를 재구성하는 지능적인 과정을 거친다는 것을 밝혀냈습니다.

  • 일상적인 예시: 우리가 외국어를 배울 때, 낯선 알파벳을 하나씩 읽다가 문맥을 파악하면 "아, 이건 'Hello'구나!"라고 알아차리는 것과 비슷합니다. AI 도 똑같은 방식으로, 훈련받지 않은 입력 방식 (문자 단위) 에도 유연하게 적응할 수 있는 것입니다.

한 줄 요약:

"AI 는 흩어진 알파벳 조각을 받으면, 초기 단계에서 서로 대화하며 다시 단어를 조립 (복구) 하고, 그 완성된 단어를 바탕으로 똑똑한 대답을 합니다. 이 '조립 과정'이 AI 의 놀라운 적응력을 만드는 비결입니다."