Over-representation of phonological features in basic vocabulary doesn't replicate when controlling for spatial and phylogenetic effects

이 연구는 2,864 개 언어의 데이터를 활용하여 공간적 및 계통발생적 요인을 통제함으로써 기존 기본 어휘의 음운론적 특징 과대표성 주장 대부분이 재현되지 않음을 보여주고, 소수의 안정된 패턴만 남음을 규명했습니다.

Frederic Blum

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍳 요리 비유: "소리의 맛"을 찾아서

1. 이전 연구: "요리사들의 비밀 레시피"

과거의 언어학자들은 전 세계 245 개 언어를 조사하며 흥미로운 패턴을 발견했다고 주장했습니다.

  • 주장: "어떤 음식 (의미) 은 특정 재료 (소리) 로만 만들어지는 경향이 있어!"
    • 예: '코 (nose)'라는 말은 대부분 'ㄴ (n)'소리를 포함하고, '혀 (tongue)'는 'ㄹ (l)'소리를 많이 쓴다는 식입니다.
  • 해석: 이는 우연이 아니라, 인간의 뇌가 소리와 의미를 자연스럽게 연결하는 **'보편적인 심리 현상 (상징성)'**이 있기 때문이라고 믿었습니다. 마치 "매운 음식에는 고추가 꼭 들어간다"는 법칙이 있는 것처럼요.

2. 새로운 연구: "더 넓은 주방과 정밀한 저울"

이번 연구의 저자 (프레데릭 블룸) 는 "그런데 그 결론이 정말 믿을 만한가?"라고 의문을 품었습니다.

  • 문제점: 과거 연구는 샘플이 작았고, 언어 간의 **가족 관계 (계보)**나 지리적 인접성을 고려하지 않았습니다.
    • 비유: 만약 "한국, 일본, 중국 요리"만 조사해서 "동아시아 요리는 모두 매운맛이다"라고 결론 내렸다면, 이는 전 세계 요리를 대표하지 못합니다. 또한, 일본 요리가 한국 요리와 비슷하다고 해서 "우연의 일치"가 아니라 "서로 영향을 주고받았기 때문"일 수 있습니다.
  • 새로운 접근: 저자는 Lexibank라는 거대한 데이터베이스를 이용해 2,800 개 이상의 언어를 조사했습니다. 그리고 과거 연구에서 놓쳤던 **'가족 관계 (계보)'**와 **'지리적 거리 (접촉)'**라는 두 가지 중요한 변수를 통계적으로 통제했습니다.
    • 비유: 이제 우리는 전 세계 모든 요리를 조사하고, "이 요리는 이웃 나라에서 배운 거야" 혹은 "이 요리는 같은 가족이라서 비슷해"라는 점을 저울로 정확히 재서 빼고 분석한 것입니다.

3. 연구 결과: "대부분의 레시피는 사라졌다"

놀라운 결과가 나왔습니다.

  • 결과: 과거 연구에서 발견된 '소리 - 의미'의 강력한 연결고리 대부분이 사라졌습니다.
    • 과거에 "코는 n 소리를 쓴다"고 믿었던 많은 사례가, 가족 관계와 지리적 영향을 보정해 주니 통계적으로 의미 있는 패턴이 아니었던 것으로 밝혀졌습니다.
    • 마치 "동아시아 요리는 매운맛이다"라고 생각했는데, 실제로는 한국과 일본이 서로 영향을 주고받았을 뿐, 전 세계 요리에 그런 법칙이 없다는 것을 깨달은 것과 같습니다.
  • 남은 것: 아주 드물게, **1 인칭 대명사 (나/나)**나 **2 인칭 대명사 (너)**와 관련된 몇몇 소리, 그리고 '배꼽', '혀' 같은 몇 가지 몸 부위 단어에서만 소리와 의미의 연결이 단단하게 남았습니다.

4. 결론: "우리는 무엇을 배웠는가?"

이 연구는 우리에게 중요한 교훈을 줍니다.

  1. 과거의 과신 경계: 언어학자들이 "전 세계 언어에 이런 보편적인 법칙이 있다"고 너무 성급하게 결론 내렸을 수 있습니다.
  2. 데이터의 중요성: 작은 샘플로 결론 내리지 말고, 가능한 한 많은 데이터를 수집해야 합니다.
  3. 통계의 엄격함: 언어는 서로 영향을 주고받기 때문에 (가족 관계, 지리적 접촉), 이를 통계적으로 보정하지 않으면 **가짜 신호 (False Positive)**를 진짜로 착각할 수 있습니다.

💡 한 줄 요약

"과거에 발견된 '소리와 의미의 비밀 연결고리' 대부분은 사실 언어들이 서로 닮았거나 (가족 관계), 이웃해서 비슷해졌기 (지리적 접촉) 에 생긴 착각이었으며, 진짜로 전 세계적으로 통하는 법칙은 아주 드물게만 존재한다는 것을 2,800 개 언어로 증명했습니다."

이 연구는 과학적 발견이 얼마나 신중하게 검증되어야 하는지, 그리고 **"더 많은 데이터와 더 정교한 분석"**이 얼마나 중요한지 보여주는 훌륭한 사례입니다.