The Long Delay to Arithmetic Generalization: When Learned Representations Outrun Behavior

이 논문은 알고리즘적 작업에서 학습된 표현이 행동 일반화보다 앞서 존재함에도 불구하고 디코더의 병목 현상과 수계 표현 방식 (기수) 에 따른 인덕티브 바이어스 때문에 '그로킹 (grokking)' 현상이 지연된다는 것을 보여줍니다.

Laura Gomezjurado Gonzalez

게시일 2026-04-16
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎬 비유: "천재 건축가"와 "서툰 화가"

이 연구는 두 명의 인물이 함께 그림을 그리는 상황을 상상해 보세요.

  1. **건축가 **(인코더) : 그림의 뼈대, 구조, 구도를 완벽하게 설계합니다.
  2. **화가 **(디코더) : 그 설계도를 보고 실제 그림을 그립니다.

1. 문제 상황: "왜 그림이 안 그려질까?"

일반적으로 이 두 사람은 훈련을 받습니다. 처음에는 둘 다 서툴러서 그림이 엉망입니다. 그런데 이상한 일이 발생합니다.

  • 건축가는 훈련 시작 몇 시간 만에 이미 완벽한 설계도를 그립니다. (수학적으로 필요한 모든 구조를 이미 알고 있습니다.)
  • 하지만 화가는 그 설계도를 보고도 그림을 제대로 그리지 못합니다.
  • 결과적으로, **완벽한 설계도가 있어도 실제 그림 **(정답)
  • 이 긴 기다림 기간을 연구자들은 **'그로킹 **(Grokking, 갑작스러운 깨달음)이라고 부릅니다.

2. 핵심 발견: "지식은 있는데, 표현을 못 하는 것"

연구진은 "아마도 건축가가 구조를 배우는 데 시간이 걸리는 게 아니라, 화가가 설계도를 읽는 데 시간이 걸리는 것"이라고 의심했습니다. 이를 증명하기 위해 실험을 했습니다.

  • **실험 1 **(건축가 교체) : 이미 완벽한 설계도를 그린 숙련된 건축가를 데려와, 서툰 화가와 짝을 지었습니다.
    • 결과: 화가는 설계도를 보고 바로 그림을 그릴 수 있게 되어, 학습 속도가 2.75 배 빨라졌습니다.
  • **실험 2 **(화가 교체) : 서툰 화가를 버리고 숙련된 화가를 데려와, 초보 건축가와 짝을 지었습니다.
    • 결과: 오히려 그림이 더 엉망이 되었습니다.

결론: 문제는 "무엇을 배울지 모르는 것"이 아니라, **"배운 것을 어떻게 출력 **(그림)였습니다. 건축가는 이미 모든 걸 알고 있었지만, 화가가 그걸 해석하는 데 너무 오래 걸린 것입니다.

3. 결정적 변수: "숫자를 어떻게 쓰느냐?" (진법)

그런데 화가의 실력은 **숫자를 표현하는 방식 **(진법)에 따라 극적으로 달라졌습니다.

  • **2 진법 **(Binary) : 숫자를 0 과 1 로만 표현하면, 화가는 완전히 망가집니다. 설계도가 아무리 완벽해도, 0 과 1 로만 된 복잡한 구조를 해석할 수 없어 아예 그림을 못 그리게 됩니다. (이론상으로는 가능하지만, 실제로는 붓을 놓아버립니다.)
  • 24 진법 : 숫자를 24 개 기호로 표현하면, 화가는 99.8% 의 완벽한 그림을 그립니다.
  • 이유: 24 진법은 수학적인 규칙 (콜라츠 추측) 과 잘 맞습니다. 마치 화가가 "이런 색은 이렇게 섞으면 돼"라는 쉬운 규칙을 가진 팔레트를 받은 것과 같습니다. 반면 2 진법은 규칙이 너무 복잡해서 화가가 혼란을 겪는 것입니다.

4. 요약: 무엇을 배웠는가?

이 논문의 핵심 메시지는 다음과 같습니다.

"인공지능이 문제를 푸는 데 실패할 때, 그것은 '지식을 배우지 못해서'가 아니라 '배운 지식을 출력하는 방법을 아직 찾지 못해서'일 수 있다."

  • **건축가 **(인코더)는 아주 빨리 모든 수학적 규칙을 이해합니다.
  • **화가 **(디코더)는 그 규칙을 실제 답으로 바꾸는 데 훨씬 더 오래 걸립니다.
  • 특히 **숫자를 어떻게 표현하느냐 **(진법)에 따라 화가의 난이도가 결정됩니다.

🚀 이 연구가 중요한 이유

우리가 AI 가 왜 갑자기 똑똑해지는지 (그로킹 현상) 이해하는 데 중요한 단서를 줍니다. AI 는 이미 알고 있을지도 모릅니다. 다만, 우리가 그걸 꺼내 쓰는 방법을 가르쳐주거나, AI 가 그걸 꺼내기 쉬운 환경 (올바른 진법 등) 을 만들어주면 훨씬 더 빨리, 더 잘 작동할 수 있다는 뜻입니다.

마치 천재 학생이 시험지를 받았는데, 문제를 다 풀었어도 '답안지 작성법'을 몰라서 점수를 못 받는 상황과 비슷하다고 볼 수 있습니다. 이 연구는 그 '답안지 작성법'을 어떻게 개선할지 알려줍니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →