Each language version is independently generated for its own context, not a direct translation.
이 논문은 거대 인공지능 (LLM) 이 어떻게 언어를 배우는지에 대한 깊은 의문을 던지며 시작합니다. "인공지능이 아이들처럼 먼저 쉬운 문법을 배우고 점점 어려운 것을 배울까, 아니면 모든 것을 한 번에 동시에 배우는 걸까?"라는 질문이죠.
연구자들은 복잡한 언어 규칙을 수학적으로 정의한 문법 (CFG) 을 이용해 이 문제를 파헤쳤습니다. 핵심은 문법이라는 거대한 나무를 작은 가지 (서브문법, Subgrammar) 로 쪼개어 보는 것입니다.
이 논문의 내용을 일상적인 비유로 쉽게 설명해 드릴게요.
1. 문법이라는 거대한 레고 세트
언어 문법 (CFG) 을 상상해 보세요. 마치 거대한 레고 성을 짓는 것과 같습니다.
- 전체 문법: 완성된 거대한 성.
- 서브문법 (Subgrammar): 이 성을 이루는 작은 부품들 (벽, 창문, 지붕) 이나, 성의 특정 층 (1 층, 2 층) 을 의미합니다.
연구자들은 "AI 가 이 거대한 레고 성을 배울 때, 작은 부품부터 하나하나 배우는가, 아니면 성 전체를 한 번에 통째로 이해하는가?"를 연구했습니다.
2. 놀라운 발견: AI 는 '동시 학습'을 한다!
아이들은 보통 먼저 '사과'나 '사과' 같은 간단한 단어를 배우고, 나중에는 복잡한 문장을 배웁니다. 하지만 이 연구에서 작은 AI 모델 (트랜스포머) 을 실험해 보니 놀라운 결과가 나왔습니다.
- 아이의 학습: 계단식 (쉬운 것 → 어려운 것).
- AI 의 학습: 동시 학습 (Parallel Learning).
AI 는 문법의 작은 조각 (서브문법) 하나하나를 따로따로, 그리고 동시에 배우고 있었습니다. 마치 거대한 레고 성을 짓는 데, 벽돌 하나하나를 동시에 쌓아 올리는 것처럼요. 이론적으로 증명된 바에 따르면, AI 가 배우는 '손실 (오차)'이라는 것은 각 작은 부품 (서브문법) 의 오차들을 모두 더한 것과 같습니다. 그래서 AI 는 모든 부품을 한꺼번에 최적화하는 경향이 있습니다.
3. '미리 공부' (프리트레이닝) 의 효과: 작은 아이에게는 도움이 되지만...
연구자들은 "먼저 작은 문법 (서브문법) 만 가르치고, 그다음에 전체 문법을 가르치면 (커리큘럼 학습) 더 잘 배우지 않을까?"라고 궁금해했습니다.
- 작은 모델 (초보 학생): 미리 작은 문법을 배우게 했더니, 최종 점수가 올라갔습니다. 마치 수학 문제를 풀 때 먼저 덧셈을 완벽하게 익히고 나눗셈을 배운 것처럼요.
- 큰 모델 (고수 학생): 이미 머리가 좋은 큰 모델은 미리 공부하든 말든, 처음부터 다 배우든 최종 점수는 비슷했습니다.
하지만 흥미로운 점은, 내부적인 생각 (표현) 이 달라졌다는 것입니다. 미리 공부한 모델은 문법의 구조를 더 명확하게 이해하고 있었습니다. 마치 레고 부품을 분류해 둔 상자를 가진 것과 같아서, 전체 성을 지을 때 부품을 찾는 속도가 훨씬 빨라진 것입니다.
4. AI 의 한계: '깊이'가 문제지 '길이'가 아니다
가장 중요한 결론 중 하나는 AI 가 문장의 길이는 잘 처리하지만, 문법의 깊이 (중첩된 구조) 에는 여전히 약하다는 것입니다.
- 비유: 긴 줄을 밧줄로 묶는 것 (길이) 은 쉽지만, 밧줄을 여러 번 겹겹이 감아 복잡한 매듭을 만드는 것 (깊이/재귀) 은 AI 가 어려워합니다.
- 실험 결과: 아주 간단한 괄호 문법
( ( ( ... ) ) )에서, 괄호의 깊이가 깊어질수록 AI 는 실수를 하기 시작했습니다. 최신 거대 모델 (GPT 등) 도 이 '깊이' 문제에서는 여전히 고전하고 있었습니다.
5. 요약: 이 논문이 우리에게 주는 메시지
- AI 는 아이와 다릅니다: AI 는 쉬운 것부터 배우지 않고, 문법의 모든 조각을 동시에 배우는 경향이 있습니다.
- 작은 모델은 '미리 공부'가 효과적: 아주 작은 AI 에게는 단계별 학습 (커리큘럼) 이 도움이 되지만, 큰 AI 에겐 큰 차이가 없습니다.
- 깊은 생각은 아직 어렵다: AI 는 긴 문장은 잘 읽지만, 문장 안의 복잡한 중첩 구조 (깊은 재귀) 를 이해하는 데는 한계가 있습니다. 이는 AI 가 단순히 패턴을 맞추는 것이지, 진짜 문법 구조를 완벽하게 이해하지는 못함을 시사합니다.
한 줄 결론:
AI 는 거대한 언어 문법을 '조각조각'으로 나누어 동시에 배우는 천재이지만, 그 조각들이 너무 깊게 겹쳐진 복잡한 구조 앞에서는 여전히 인간의 두뇌처럼 유연하게 생각하지 못하는 '약점'을 가지고 있습니다.