The Astonishing Ability of Large Language Models to Parse Jabberwockified Language

이 논문은 대규모 언어 모델 (LLM) 이 무의미한 단어로 대체된 텍스트에서도 문법적 구조와 세계 지식을 활용해 원문의 의미를 놀라운 정확도로 복원할 수 있음을 보여주며, 이는 언어 처리에서 구문론과 어휘적 의미, 그리고 일반 지식이 긴밀하게 통합되어야 함을 시사합니다.

Gary Lupyan, Senyi Yang

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 핵심 비유: "완벽한 추리소설"

상상해 보세요. 누군가에게 모든 명사와 동사를 지우고, 대신 "블라블라", "후후후" 같은 소리를 넣은 편지를 주었다고 칩시다.

*"어느 날 블라블라후후후짱짱했다. 그래서 뿅뿅꾸욱했다."*

일반인 (사람) 은 이걸 보고 "아무것도 모르겠다"고 생각합니다. 하지만 최신 AI 는 이렇게 말합니다.

*"아, 문장 구조를 보니 블라블라는 '사람'이고, 후후후는 '사과'고, 짱짱은 '먹다'라는 뜻이군. 그리고 뿅뿅은 '개'고 꾸욱은 '울다'겠네. 결론: 어느 날 아이가 사과를 먹어서 개가 울었다."*

이 논문은 AI 가 어떻게 이런 완벽한 추리를 해내는지, 그리고 그 비결이 무엇인지 보여줍니다.


🔍 1. 실험: "의미 없는 글"을 어떻게 해석했나?

연구자들은 실제 글 (예: "영화 시작하자마자 우리는 차우 모완을 만났다...") 의 **실제 단어들 (명사, 동사 등)**을 모두 무작위 가짜 단어로 바꿔버렸습니다.

  • 원문: "At the start of the film..."
  • 바뀐 글: "At the ghybe of the swuint..." (의미 없는 소리)

그런데 AI 가 이 가짜 글을 입력받고 "원래 영어로 번역해줘"라고 요청하자, 놀랍게도 원래 글과 거의 똑같은 뜻으로 다시 만들어냈습니다.

🧩 2. AI 의 비밀 무기: "문법이라는 뼈대"와 "세상 지식"

AI 가 이걸 해낸 이유는 무엇일까요? 연구자들은 두 가지 핵심 요소를 발견했습니다.

① 문법이라는 '뼈대'가 살을 붙여준다

사람은 "의미 없는 단어"만 보면 당황하지만, AI 는 **문장 구조 (어떤 단어가 어디에 오는지)**를 아주 잘 봅니다.

  • 비유: 건물을 짓는다고 생각해보세요. 벽돌 (단어) 이 다 사라지고 **철골 (문법)**만 남아있어도, AI 는 그 철골의 모양을 보고 "아, 이 철골은 '벽'을 받치는 거구나, 저 철골은 '지붕'을 받치는 거구나"라고 추측합니다.
  • 예를 들어, "그가 뿅뿅꾸욱했다"라는 문장에서, 뿅뿅은 '물체'로 쓰였고, 꾸욱은 '행동'으로 쓰였다는 문법적 단서만으로도 AI 는 "아, 뿅뿅은 사물이고 꾸욱은 동작이야"라고 추론합니다.

② 세상 지식 (상식) 이 연결고리가 된다

문법만으로는 부족합니다. AI 는 세상에 대한 방대한 지식을 가지고 있습니다.

  • 비유: "차를 블라블라했다"라는 문장이 있다면, 문법만으로는 '블라블라'가 '세차'인지 '수리'인지 '부수기'인지 알 수 없습니다. 하지만 AI 는 "차 + 주차할 곳이 없다 = 블라블라는 '주차'일 것이다"라는 세상 상식을 연결합니다.
  • 연구 결과, 가짜 단어들이 섞여 있어도 **문장 전체의 흐름 (맥락)**만 있으면 AI 는 그 흐름에 맞는 가장 그럴듯한 단어를 찾아냅니다.

📊 3. 놀라운 발견들

이 연구에서 나온 몇 가지 재미있는 사실들이 있습니다.

  • 사람보다 훨씬 잘한다: 사람이라면 "이건 뜻모를 소리야"라고 포기할 텐데, AI 는 가짜 글에서도 60~90% 정도까지 원래 뜻을 맞췄습니다. (물론 완벽하지는 않습니다.)
  • 훈련된 글이 아니어도 된다: AI 가 이전에 그 글을 본 적이 없어도 (새로운 학생 에세이 등), 문법과 맥락만 있으면 완벽하게 해석했습니다. 이는 AI 가 단순히 "기억"을 꺼내는 게 아니라, 문법과 논리를 진짜로 이해하고 있다는 뜻입니다.
  • 가장 중요한 건 '기능어' (작은 단어): 연구자들은 'the', 'a', 'is', 'and' 같은 작은 단어들을 지우지 않고 남겼습니다. 이 작은 단어들이 문장의 뼈대 역할을 해서, AI 가 가짜 단어들의 뜻을 유추하는 데 결정적인 도움을 줍니다. 마치 퍼즐의 가장자리 조각들이 전체 그림을 알려주는 것과 같습니다.

💡 4. 결론: 왜 이 연구가 중요한가?

이 연구는 우리에게 언어가 어떻게 작동하는지에 대한 새로운 통찰을 줍니다.

  • 사람과 AI 의 공통점: 사람도 문법과 상식을 섞어서 언어를 이해합니다. AI 는 이 과정을 엄청나게 정교하게 수행할 뿐입니다.
  • 분리된 것이 아닌 통합된 것: 언어를 이해하려면 '문법', '단어 뜻', '세상 지식'을 따로따로 처리하는 게 아니라, 이 모든 것을 한데 엮어서 동시에 처리해야 한다는 것을 보여줍니다.

🎁 한 줄 요약

"AI 는 가짜 단어 (재버워키) 로 뒤섞인 글에서도, 문법이라는 '뼈대'와 세상 지식이라는 '살'을 완벽하게 연결해, 마치 원래 글을 읽은 것처럼 정확한 뜻을 찾아냅니다. 이는 언어 이해가 단순한 단어 암기가 아니라, 문맥과 구조의 놀라운 통합임을 보여줍니다."

이 연구는 AI 가 단순히 말을 흉내 내는 '패러디'가 아니라, 언어의 깊은 구조를 이해하는 '진짜 이해'에 한 걸음 더 다가섰음을 시사합니다.