Robust Testing Of the Allais Paradox By Paired Choices vs. Paired Valuations

이 논문은 McGranaghan 등 (2024) 이 주장한 평가 (valuation) 방식의 우월성을 반박하며, 확률적 선택 이론 하에서 평가 방식은 편향되고 예측력이 부족하지만 '강한' 짝짓기 선택 (paired choice) 방식은 편향되지 않아 기존 문헌의 아를스 역설 (Allais Paradox) 현상이 여전히 유효함을 입증했습니다.

Federico Echenique, Gerelt Tserenjigmid

게시일 2026-04-08
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 경제학의 유명한 난제인 **'앨리스 역설 (Allais Paradox)'**을 다시 한번 파헤치며, "우리가 실험을 잘못 설계하고 있었을지도 모른다"는 흥미로운 주장을 펼칩니다.

핵심 내용을 요리조리 설명해 드릴게요.

1. 배경: "확률의 배수"라는 함정

먼저, 앨리스 역설의 핵심인 **'공통 비율 효과 (Common Ratio Effect)'**를 이해해야 합니다.

  • 상황 A: 100% 확률로 100 만 원을 받거나, 80% 확률로 150 만 원을 받거나? (대부분은 100 만 원을 선택합니다.)
  • 상황 B: 100 만 원을 80% 확률로 받거나, 150 만 원을 64% (80% 의 80%) 확률로 받거나? (이때는 많은 사람이 150 만 원을 선택합니다.)

이론적으로 (기대효용 이론), 두 상황은 같은 비율로 확률이 줄어든 것이므로 선택이 일관되어야 합니다. 하지만 사람들은 일관되지 않게 선택합니다. 이것이 바로 '역설'입니다.

2. 최근의 논란: "실험 방법이 틀렸다?"

최근에 나온 한 연구 (MNOSS) 는 "아니요, 사람들이 일관되지 않게 선택하는 게 아니라, 우리가 실험을 잘못 측정하고 있는 것"이라고 주장했습니다.

  • 기존 방법 (선택 테스트): "A 와 B 중 뭐가 더 좋아요?"라고 물어서 A 를 고르는 비율이 60% 라면, C 와 D 중 C 를 고르는 비율도 60% 여야 한다고 봅니다.
  • 새로운 주장: "사람은 기계가 아니니까 실수 (노이즈) 를 합니다. 그래서 A 를 고르는 비율이 60% 라도, 그건 A 가 정말 더 좋다는 뜻이 아니라, 단순히 우연에 가깝습니다. 대신 **'가치 평가 (Valuation)'**를 하세요. 즉, "이 로또를 현금으로 바꾼다면 얼마를 주겠어요?"라고 물어보라고 합니다.
  • MNOSS 의 결론: 가치 평가 실험을 해보니, 사람들이 일관되지 않게 행동한다는 증거가 거의 없었다! 그래서 "앨리스 역설은 사실일지 모른다"고 결론 내렸습니다.

3. 이 논문의 반격: "아니요, 가치 평가가 더 문제입니다!"

저자 에체니케와 체렌지그미드는 "MNOSS 가 제안한 가치 평가 (Valuation) 방법이 오히려 더 큰 함정"이라고 반박합니다.

🍎 비유: 사과와 배의 가격 매기기

  • 선택 테스트 (Pair Choice): "사과와 배 중 뭐가 더 좋아요?"라고 묻는 겁니다.
  • 가치 평가 (Valuation): "사과를 사려면 얼마를 줄래? 배는 얼마?"라고 묻는 겁니다.

저자들은 가치 평가는 다음과 같은 문제가 있다고 말합니다:

  1. 사람의 위험 회피 성향 (Risk Aversion) 에 따라 결과가 완전히 달라집니다. 사과를 좋아하는 사람이 배를 싫어하는지, 아니면 단순히 가격이 비싸서 싫어하는지 구분하기 어렵습니다. 마치 "사과와 배의 가격 차이"를 재는데, 저울이 사람마다 다르게 흔들리는 것과 같습니다.
  2. 결과를 마음대로 조작할 수 있습니다. 수학적으로 증명했듯이, 가치 평가 실험에서는 "어떤 결과가 나오든 다 설명할 수 있다 (Anything goes)"는 결론이 나옵니다. 즉, 실험 결과가 무의미해질 수 있습니다.

🛡️ 새로운 제안: "강한 선택 테스트 (Strong Paired Choice)"

저자들은 기존에 쓰이던 '약한 선택 테스트'도 문제가 있지만, 완전히 버릴 필요는 없다고 말합니다. 대신 **'강한 선택 테스트'**를 제안합니다.

  • 약한 테스트: "A 를 고른 비율이 C 를 고른 비율보다 정확히 높으면 역설이다." (이건 노이즈 때문에 틀릴 수 있음)
  • 강한 테스트: "A 를 고른 비율이 **50% 이상 (대부분)**이고, C 를 고른 비율이 **50% 미만 (소수)**이면 역설이다."

비유:

  • 약한 테스트: "A 를 고른 사람이 51 명, C 를 고른 사람이 50 명이면 A 가 더 좋아?" (아니요, 그냥 우연일 수 있어요.)
  • 강한 테스트: "A 를 고른 사람이 80 명, C 를 고른 사람이 20 명이면 A 가 확실히 더 좋아." (이건 우연이 아니죠!)

이 '강한 테스트'는 다양한 노이즈 모델 (사람의 실수, 편향 등) 을 고려해도 공정하고 편향되지 않는다는 것을 수학적으로 증명했습니다.

4. 결론: 다시 돌아온 진실

저자들은 이 '강한 선택 테스트'를 기존에 쌓아온 수많은 실험 데이터에 적용해 보았습니다.

  • MNOSS 의 결론: "역설은 없다." (가치 평가 실험 결과)
  • 이 논문의 결론: "역설은 여전히 강력하게 존재한다!" (강한 선택 테스트 결과)

데이터를 다시 분석해보니, 약 40% 이상의 실험에서 사람들이 여전히 일관되지 않은 선택을 하고 있었습니다. 즉, 앨리스 역설은 사라지지 않았고, 우리가 실험 방법을 잘못 고른 것이었습니다.

📝 한 줄 요약

"최근 어떤 연구자들이 "사람들은 일관되게 행동한다, 우리가 실험을 잘못했다"고 주장했지만, 우리는 "아니요, 그 실험 방법 (가치 평가) 이 더 문제였다"고 반박했습니다. 올바른 방법 (강한 선택 테스트) 으로 다시 보니, 사람들은 여전히 예측 불가능하고 흥미롭게 행동하고 있었습니다."

이 논리는 경제학뿐만 아니라, 인간의 의사결정을 연구하는 모든 분야에서 **"어떻게 측정하느냐가 결론을 바꾼다"**는 중요한 교훈을 줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →