ReasonXL: Shifting LLM Reasoning Language Without Sacrificing Performance

이 논문은 5 개 유럽 언어로 구성된 대규모 ReasonXL 데이터셋을 활용하여 LLM 이 성능 저하 없이 목표 언어로 추론할 수 있도록 하고, 언어 정체성은 초기 층에서, 적응은 상위 층에서 발생하며 RLVR 이 SFT 보다 효율적인 표현 재구성을 가능하게 함을 규명했습니다.

Daniil Gurgurov, Tom Röhr, Sebastian von Rohrscheidt, Josef van Genabith, Alexander Löser, Simon Ostermann

게시일 2026-04-15
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌍 ReasonXL: AI 의 '사고 언어'를 바꾸는 마법

이 논문은 **"인공지능 (AI) 이 영어로만 생각하는 습관을 고쳐, 우리가 쓰는 언어 (독일어, 프랑스어 등) 로 직접 생각하게 만들 수 있을까?"**라는 질문에 대한 답을 찾은 흥미로운 연구입니다.

기존의 AI 는 아무리 한국어나 스페인어로 질문을 해도, 생각하는 과정 (추론) 은 여전히 영어로 하고 그 결과만 번역해서 보여주는 경우가 많았습니다. 마치 외국인이 한국어를 배우려 할 때, 머릿속에서는 영어로 생각하다가 입으로만 한국어를 내뱉는 것과 비슷하죠. 이 논문은 그 '생각의 언어' 자체를 바꿔버리는 방법을 제시합니다.


🧩 핵심 비유: "요리사의 언어 바꾸기"

이 연구를 쉽게 이해하기 위해 **'요리사 (AI)'**와 **'레시피 (추론 과정)'**를 상상해 보세요.

  1. 현재의 문제점:

    • 대부분의 AI 요리사는 영어로 된 레시피만 보고 요리를 합니다.
    • 한국 손님이 "김치찌개 만들어줘"라고 주문하면, 요리사는 머릿속에서 **"Kimchi Jjigae recipe (English)"**를 검색하고 생각한 뒤, 완성된 요리를 한국인에게 건네줍니다.
    • 문제는 요리사가 생각하는 과정이 영어라서, 한국 손님이 "왜 이렇게 만들었지?"라고 물어보면 설명이 어색하거나, 문화적 뉘앙스가 깨질 수 있다는 점입니다.
  2. 이 논문의 해결책 (ReasonXL):

    • 연구팀은 200 만 개 이상의 '생각하는 과정 (추론)'이 담긴 레시피를 독일어, 프랑스어, 이탈리아어, 스페인어로 새로 만들었습니다. 이를 **'ReasonXL'**이라고 부릅니다.
    • 이제 AI 요리사에게 한국어 (또는 각 언어) 로 된 레시피만 보여주며 훈련시킵니다.
    • 결과? AI 는 이제 생각하는 과정부터 해당 언어로 자연스럽게 흘러가게 되었습니다.

🚀 어떻게 했나요? (두 단계 훈련법)

연구팀은 AI 의 사고방식을 바꾸기 위해 두 단계로 나누어 훈련시켰습니다.

1 단계: "새로운 언어로 읽기" (지도 학습, SFT)

  • 비유: 요리사에게 새로운 언어로 된 레시피 책을 쑤셔 넣는 과정입니다.
  • AI 가 영어가 아닌 다른 언어로 생각하도록 강제로 가르칩니다.
  • 결과: AI 는 이제 질문을 받으면 해당 언어로 생각하기 시작하지만, 요리 실력 (정답률) 이 조금 떨어집니다. 마치 새로운 언어로 생각하느라 요리가 느려지거나 실수가 생기는 것과 비슷합니다.

2 단계: "실전 연습과 보상" (강화 학습, RL)

  • 비유: 요리사가 새로운 언어로 생각하면서도 맛있는 요리를 잘 만들 수 있도록 코치가 옆에서 "그렇게 해! 맞았어!"라고 칭찬하며 훈련시키는 과정입니다.
  • AI 가 정답을 맞출 때마다 보상을 주고, 언어를 잘 유지하도록 훈련시킵니다.
  • 결과: 놀랍게도 요리 실력 (정답률) 이 다시 원래대로, 혹은 그 이상으로 회복되었습니다. 이제 AI 는 생각도 해당 언어로 하고, 요리도 완벽하게 합니다.

🔍 AI 의 뇌는 어떻게 변했나요? (기계적 분석)

연구팀은 AI 의 내부 구조를 들여다보며 흥미로운 사실을 발견했습니다.

  • 뇌의 깊은 곳 (상위 층): AI 의 '상위 층'은 **생각의 내용 (수학 문제 풀이, 논리)**을 담당합니다. 훈련을 통해 이 부분의 무게가 많이 변했습니다.
  • 뇌의 중간 층 (6~8 층): 여기서 가장 중요한 **'언어 스위치'**가 발견되었습니다.
    • 마치 전환 스위치처럼, 이 특정 층만 바꿔주면 AI 가 영어로 생각하던 것을 프랑스어나 스페인어로 생각하게 바꿀 수 있었습니다.
    • 비유: 건물의 1 층5 층은 '재료 준비', 68 층은 '언어 선택 버튼', 9 층 이상은 '요리 완성'이라고 생각하면 됩니다. 연구팀은 이 '언어 선택 버튼'을 정확히 찾아내어 조작한 것입니다.

💡 왜 이것이 중요한가요?

  1. 신뢰와 투명성: 사용자가 자신의 모국어로 AI 의 생각 과정을 직접 볼 수 있어, "왜 이런 답을 냈지?"를 이해하기 훨씬 쉬워집니다.
  2. 문화적 뉘앙스: 영어로 생각하다 번역하는 과정에서 사라질 수 있는 문화적 맥락이나 정서가, 원래 언어로 생각하면 살아납니다.
  3. 성능 유지: 언어를 바꾸었다고 해서 AI 가 바보가 되는 것이 아니라, 오히려 더 똑똑해질 수도 있음을 증명했습니다.

🎯 결론

이 논문은 **"AI 가 영어라는 '중국어'를 거치지 않고, 우리 언어로 직접 생각할 수 있다"**는 것을 증명했습니다. 마치 외국인 요리사가 한국 레시피로 직접 한국 음식을 생각하며 요리하는 것처럼, 이제 AI 는 우리의 언어로 더 깊고 정확하게 사고할 수 있게 되었습니다.

이는 AI 가 전 세계 모든 언어 사용자에게 더 친근하고 신뢰할 수 있는 도구가 될 수 있는 중요한 첫걸음입니다. 🌟

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →