Modelling the Diachronic Emergence of Phoneme Frequency Distributions

이 논문은 기능적 부하와 선호되는 음소 수에 대한 안정화 경향이라는 두 가지 가정을 포함한 확률적 모델을 통해, 음소 빈도 분포의 통계적 규칙성이 최적화 메커니즘이 아닌 역사적 음운 변화의 자연스러운 결과로 나타날 수 있음을 보여줍니다.

Fermín Moscoso del Prado Martín, Suchir Salhan

게시일 Wed, 11 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"언어의 소리 (음소) 가 어떻게 만들어지고, 왜 특정 규칙을 따르게 되는가?"**에 대한 흥미로운 질문에서 시작합니다.

저자들은 복잡한 수학적 모델을 통해, 언어가 수천 년 동안 어떻게 변해왔는지 시뮬레이션했습니다. 그 결과는 매우 놀랍습니다. 우리가 언어에서 발견하는 복잡한 통계적 규칙들이, 의도적인 설계나 최적화 때문이 아니라 단순한 '우연'과 '시간'의 흐름 속에서 자연스럽게 생겨난 것일 수 있다는 것입니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드리겠습니다.


1. 연구의 배경: 언어는 왜 이렇게 생겼을까?

우리가 세계의 다양한 언어를 분석하면 두 가지 흥미로운 패턴을 발견합니다.

  1. 소리 분포: 어떤 소리는 아주 자주 나오고, 어떤 소리는 거의 안 나옵니다. 이 분포는 마치 '지수함수'처럼 꼬리가 길게 늘어지는 모양을 합니다.
  2. 소리의 개수와 정보량: 소리의 종류 (음소) 가 많은 언어일수록, 각 소리가 전달하는 '정보의 밀도'는 오히려 낮아지는 경향이 있습니다. (소리가 많으면 각 소리가 구별해야 할 일이 줄어들기 때문입니다.)

기존에는 이것이 언어가 의도적으로 효율을 높이기 위해 (최적화) 그렇게 변했을 것이라고 생각했습니다. 마치 공장이 제품을 만들 때 낭비를 줄이려는 것처럼요. 하지만 저자들은 "아니면, 그냥 역사적인 우연이 쌓여서 그렇게 된 건 아닐까?"라고 의문을 품었습니다.

2. 실험: 언어의 진화를 시뮬레이션하다

저자들은 컴퓨터 안에 가상의 언어 400 개를 만들고, 1,000 번에 걸쳐 소리가 변하는 과정을 시뮬레이션했습니다. 이때 세 가지 시나리오를 시도했습니다.

1 단계: "완전한 무작위" (Naïve Model)

  • 상황: 소리가 변할 때, 어떤 소리가 변할지, 사라질지, 새로 생길지 아무런 규칙 없이 완전히 무작위로 결정했습니다.
  • 결과: 소리 분포의 모양은 실제 언어와 비슷해졌지만, 소리의 개수와 정보량 사이의 관계는 실제와 정반대가 되었습니다.
  • 비유: 마치 무작위로 알을 깨고 섞는 요리사처럼, 재료는 섞였지만 요리의 균형은 전혀 잡히지 않았습니다.

2 단계: "자주 쓰이는 소리는 보호받는다" (Functional Load)

  • 상황: 실제로는 자주 쓰이는 소리 (예: 'ㅏ', 'ㅓ' 같은 모음) 는 사라지기 어렵고, 잘 안 쓰이는 소리 (예: 특수한 발음) 는 사라지기 쉽다는 '기능적 부하' 이론을 적용했습니다.
  • 결과: 소리 분포는 더 비뚤어졌지만, 여전히 소리의 개수와 정보량 관계는 실제 언어와 맞지 않았습니다.
  • 비유: 인기 있는 아이돌은 잘 안 떨어지지만, 인기가 없는 아이돌은 쉽게 떨어지는 아이돌 그룹을 상상해 보세요. 그래도 그룹의 전체적인 '균형'은 여전히 이상했습니다.

3 단계: "적정 크기 유지" (Central Tendency) - 결정적인 순간!

  • 상황: 여기에 **'언어는 너무 작아지지도, 너무 커지지도 않는 적정 크기를 유지하려는 경향'**을 추가했습니다. 소리가 너무 적으면 새로 생기기 쉽고, 너무 많으면 사라지기 쉽도록 설정했습니다.
  • 결과: 완벽한 일치! 컴퓨터가 만들어낸 언어가 실제 세계의 언어와 똑같은 통계적 규칙을 따르기 시작했습니다.
  • 비유: 이제 인구 조절이 잘 되는 마을을 상상해 보세요.
    • 인구가 너무 적으면 (소리가 적으면) 새 주민이 들어오기 쉽습니다.
    • 인구가 너무 많으면 (소리가 너무 많으면) 주민들이 떠나기 쉽습니다.
    • 이렇게 **적정 인구 (약 34 개 소리)**를 중심으로 수천 년이 흐르자, 마을의 구조가 자연스럽게 완벽하게 조화를 이룬 것입니다.

3. 핵심 발견: "의도하지 않은 결과 (Epiphenomenon)"

이 연구의 가장 중요한 결론은 다음과 같습니다.

"언어가 효율적으로 작동하기 위해 의도적으로 규칙을 만든 것이 아니라, 단순한 소리 변화의 흐름과 '적정 크기'를 유지하려는 성향만으로도, 복잡한 통계적 규칙이 자연스럽게 만들어질 수 있다."

이를 창의적인 비유로 표현하면 다음과 같습니다:

  • 전통적인 생각: 언어는 정교한 시계처럼, 공학자가 모든 톱니바퀴를 계산해서 최적의 효율로 만들었습니다.
  • 이 논문의 발견: 언어는 강물과 같습니다. 물이 흐르면서 자연스럽게 둑을 만들고, 소용돌이를 만들며, 강바닥을 다듬습니다. 물이 "어떻게 흐르면 가장 효율적일까?"라고 생각하지 않아도, 흐르는 물의 물리 법칙만으로도 아름다운 강 모양이 만들어집니다.

4. 요약

이 논문은 언어학계에 다음과 같은 메시지를 줍니다:

  1. 복잡한 규칙은 단순한 원인에서 나올 수 있다: 언어의 통계적 규칙이 '최적화' 때문이라고만 생각하지 마세요.
  2. 역사의 힘: 수천 년 동안 소리가 변하고, 사라지고, 새로 생기는 무작위적인 과정이 쌓이면, 우리가 관찰하는 놀라운 패턴이 저절로 나타납니다.
  3. 적정 크기의 중요성: 언어는 너무 작아지지도, 너무 커지지도 않는 적정 크기를 유지하려는 성향이 있을 때, 가장 현실적인 언어가 됩니다.

결론적으로, 우리가 언어에서 보는 '완벽함'은 누군가가 설계한 것이 아니라, 시간이 흐르며 자연스럽게 굳어진 결과일 가능성이 매우 높다는 것입니다.