Differential syntactic and semantic encoding in LLMs

본 논문은 평균 표현 중심점의 차이를 통해 이러한 신호를 분리해 낼 수 있는 능력에 의해 입증되듯이, DeepSeek-V3 LLM 의 구문적 및 의미론적 정보가 부분적으로 선형적으로 인코딩되어 있으며 층 간에 차별적으로 분포되어 있음을 보여준다.

원저자: Santiago Acevedo, Alessandro Laio, Marco Baroni

게시일 2026-05-28
📖 3 분 읽기☕ 가벼운 읽기

원저자: Santiago Acevedo, Alessandro Laio, Marco Baroni

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성하거나 승인한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

DeepSeek-V3 와 같은 대규모 언어 모델 (LLM) 을 거대한 다층 도서관으로 상상해 보세요. 이 도서관 안에서 당신이 입력한 모든 문장은 건물의 각 층 (레이어) 을 통과하며 고유한 고차원 "지문"(벡터) 으로 변환됩니다.

이 논문이 제기하는 핵심 질문은 다음과 같습니다: 이 도서관은 이러한 지문들을 어떻게 조직화할까요? 구체적으로, 문장의 "구조"(구문) 와 문장의 "의미"(의미론) 를 분리하여 보관하는지, 아니면 모두 큰 스무디처럼 뒤섞여 있는지 여부입니다.

연구자들이 발견한 바를 간단히 설명하면 다음과 같습니다:

1. "평균"의 속임수 (핵심 찾기)

연구자들은 문법적으로 동일한 문장들 (예: "고양이가 앉았다", "개가 달렸다", "새가 날았다") 이 공통된 "뼈대"를 공유한다는 사실을 깨달았습니다.

  • 유추: 정확히 같은 종류의 모자를 쓴 100 명의 서로 다른 사람의 사진을 찍었다고 상상해 보세요. 이 사진들을 모두 평균내면 얼굴은 흐릿해지지만, 모자는 매우 선명하고 뚜렷하게 나타납니다.
  • 방법: 그들은 이를 수학적으로 수행했습니다. 동일한 문법 구조를 가진 문장들의 지문을 평균내어 "구문 중심점"(순수한 문법 모자) 을 만들었습니다. 또한, 같은 의미지만 다른 단어를 사용한 문장들에 대해 동일한 작업을 수행하여 "의미론적 중심점"(순수한 의미 모자) 을 만들었습니다.

2. "뺄셈" 테스트 (모자 제거하기)

이러한 "순수한" 문법과 의미 벡터를 확보한 후, 연구자들은 원래 문장 지문에서 이를 제거해 보았습니다.

  • 유추: 모자를 쓴 사람의 사진이 있다고 가정해 보세요. 사진에서 디지털 방식으로 "모자" 벡터를 빼면 모자가 사라집니다. 만약 사진이 여전히 사람처럼 보인다면, 모자는 별도의 층이었다는 뜻입니다. 만약 사람의 얼굴까지 사라진다면, 모자와 얼굴이 뒤섞여 있었다는 뜻입니다.
  • 결과: "문법 모자"를 문장에서 뺄 때, 그 문장은 동일한 문법을 가진 다른 문장들과 매칭되는 능력을 잃었습니다. "의미 모자"를 뺄 때는 같은 의미를 가진 문장들과 매칭되는 능력을 잃었습니다.
  • 결론: 이는 모델이 문법과 의미를 선형적으로 인코딩한다는 것을 증명합니다. 화학 반응처럼 새로운 물질이 되어 섞이는 것이 아니라, 수학적으로 분리 가능한 레시피의 distinct한 재료들과 같습니다.

3. "평면도" 발견 (어디에 사는가)

도서관에는 많은 층이 있습니다. 연구자들은 문법과 의미가 서로 다른 층에 거주한다는 사실을 발견했습니다.

  • 문법 (구문): 이는 기초와 낮은 층과 같습니다. 시작부터 존재하며 최상층까지 일관되게 유지됩니다. 모델은 문장의 구조를 거의 즉시 파악합니다.
  • 의미 (의미론): 이는 중간 층과 같습니다. 문장이 도서관에 들어오면 모델은 먼저 단어와 구조 (낮은 층) 를 살펴봅니다. 그런 다음 문장이 중간 층으로 이동함에 따라 모델은 그 문장이 실제로 무엇을 의미하는지 파악합니다. 최상층 (모델이 답변을 작성하는 곳) 에 도달할 때까지는 의미가 여전히 존재하지만, 초점은 출력 생성으로 이동합니다.
  • 유추: 책을 읽는 것을 생각해 보세요. 먼저 글자와 단어를 인식합니다 (문법). 그런 다음 문단의 중간에서 이야기의 흐름을 이해합니다 (의미). 이야기를 이해하기 위해 글자를 다시 인식할 필요는 없지만, 시작하려면 글자가 필요합니다.

4. 한쪽 방향의 거리 (비대칭성)

가장 흥미로운 부분은 다음과 같습니다: 이 분리는 완벽하게 대등하지 않습니다.

  • 문법은 독립적입니다: 문장에서 "의미"를 제거하면 "문법"은 완벽하게 온전하게 남습니다. 살을 제거해도 뼈대는 여전히 서 있습니다.
  • 의미는 의존적입니다: 문장에서 "문법"을 제거하면 "의미"는 약간 흔들립니다. 완전히 사라지는 것은 아니지만, 인식하기가 더 어려워집니다.
  • 유추: 집을 상상해 보세요. 가구 (의미) 를 제거하면 집 구조 (문법) 는 여전히 명확하게 집으로 남아 있습니다. 하지만 벽과 지붕 (문법) 을 제거하면 가구 (의미) 는 그냥 바닥에 쌓인 물건 덩어리에 불과해집니다; 그것이 무엇이었는지 파악하기 어렵습니다.

요약

이 논문은 이러한 거대한 AI 모델에서 다음과 같은 사실을 보여줍니다:

  1. **문법과 의미는 구별됩니다:**它们是 별개로 인코딩되며, hopelessly 섞여 있지 않습니다.
  2. 그들은 선형적입니다: 수학적으로 하나에서 다른 하나를 "뺄" 수 있습니다.
  3. 그들은 서로 다른 곳에 존재합니다: 문법은 어디에나 존재합니다 (특히 초기 단계에서), 반면 의미는 모델 처리 과정의 중간에서 정점을 이룹니다.
  4. 문법은 튼튼한 기초입니다: 의미를 제거해도 문법이 무너지지 않지만, 문법을 제거하면 의미를 붙잡아 두기가 더 어려워집니다.

이는 이러한 모델들이 단순히 다음 단어를 예측하도록 훈련되었음에도 불구하고, 인간 언어학자들이 언어가 작동한다고 생각하는 방식과 매우 유사한 구조를 자연스럽게 발전시켰음을 시사합니다. 즉, 의미의 층을 지지하는 구조적 틀을 갖춘 것입니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →