Robust Testing Of the Allais Paradox By Paired Choices vs. Paired Valuations

本文通过理论论证与实证分析指出,McGranaghan 等人提出的估值测试在随机选择框架下存在固有偏差,而采用“强”配对选择测试重新分析数据后,证实了“共同比率效应”依然普遍存在,从而反驳了该效应已被推翻的结论。

Federico Echenique, Gerelt Tserenjigmid

发布于 2026-04-08
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章就像是一场关于“人类如何做决定”的侦探小说。作者们(Echenique 和 TserenJigmid)正在调查一个著名的心理学谜题:阿莱悖论(Allais Paradox),特别是其中的“共同比率效应”。

为了让你轻松理解,我们可以把这篇论文想象成一场**“测谎仪”与“新式测谎仪”的较量**。

1. 背景:人类是个“不完美”的赌徒

想象一下,你面前有两个赌局:

  • 赌局 A:100% 拿 100 块钱。
  • 赌局 B:80% 拿 150 块钱,20% 拿 0 块。
    大多数人会选 A(求稳)。

现在,把这两个赌局都“打折”一下(比如概率都乘以 0.25):

  • 赌局 C:25% 拿 100 块钱,75% 拿 0 块。
  • 赌局 D:20% 拿 150 块钱,80% 拿 0 块。
    这时候,很多人反而选了 D(为了博取更高的回报,哪怕概率变小了)。

这就是“共同比率效应”: 理论上,如果你在第一组里喜欢 A 胜过 B,你在第二组里也应该喜欢 C 胜过 D。但人类经常“变卦”。

过去几十年的研究都发现,人类确实经常“变卦”,这证明了传统经济学理论(期望效用理论)是错的。

2. 新来的挑战者:MNOSS 团队

最近,有一群叫 MNOSS 的研究员跳出来挑战这个结论。他们说:

“等等!你们以前的测试方法(成对选择测试)有个大漏洞。因为人做决定时会犯错、会犹豫(也就是‘随机性’),这种测试就像是用一把生锈的尺子去量东西,量出来的‘变卦’其实可能是尺子不准造成的,而不是人真的变了。他们建议改用‘估值测试’(让人给赌局标价),说那才是精准的激光尺。”

MNOSS 用新尺子一量,发现大家其实挺理性的,并没有那么爱“变卦”。于是他们宣称:阿莱悖论可能是个误会,人类其实很理性。

3. 作者的反驳:生锈的尺子 vs. 错误的激光尺

这篇论文的作者(Echenique 和 TserenJigmid)不干了。他们仔细研究了 MNOSS 的方法,发现了一个惊人的真相:

MNOSS 换掉的不是“生锈的尺子”,而是换了一把“会乱跳的弹簧尺”。

比喻一:成对选择测试(旧方法)

以前的测试是问:“你选 A 还是 B?”然后看多少人选 A。

  • 弱测试(Weak Test):只要选 A 的人比选 C 的人多一点点,就算“变卦”了。
  • 强测试(Strong Test,作者提倡的):只有当超过一半的人选 A,且超过一半的人选 D(而不是 C)时,才算真正的“变卦”。

作者发现,MNOSS 批评的“弱测试”确实容易受噪音干扰(就像尺子生锈),但作者提出用**“强测试”**。这就像是在嘈杂的房间里听人说话:

  • 弱测试:只要听到有人喊“选 A",就以为大家都选 A。
  • 强测试:必须听到超过一半的人都在喊“选 A",才确认大家真的选 A。
    作者证明,无论你怎么模拟人类的“犯错”和“随机性”,“强测试”都不会被误导。它就像一把经过校准的尺子,依然能测出人类确实爱“变卦”。

比喻二:估值测试(MNOSS 的新方法)

MNOSS 让人给赌局“标价”(比如:这个 80% 拿 150 块的赌局,你愿意花多少钱买?)。
作者发现,这个“标价”的方法有个致命缺陷:它太依赖人的风险偏好了。

  • 比喻:想象你在给水果定价。如果你是个极度怕酸的人(风险厌恶),你会给酸苹果定很高的“心理价格”来补偿;如果你是个爱吃酸的人,价格就低。
  • MNOSS 的方法假设所有人的“怕酸程度”和“定价误差”都完美对称。但作者证明,只要人的风险偏好(怕不怕酸)稍微变一点,或者误差稍微有点关联,“标价”的结果就可以是任意的(Anything Goes)。
  • 这就好比用一把弹簧尺去量长度:你稍微拉一下弹簧,长度就变了。MNOSS 发现“没变卦”,可能只是因为他们用的尺子太软,把“变卦”给弹没了。

4. 核心结论:真相是什么?

作者重新分析了过去 143 项关于这个谜题的实验数据,用了他们推荐的**“强测试”**:

  1. 旧结论依然成立:当我们用更严谨的“强测试”去检查数据时,发现人类依然经常“变卦”。大约 41% 的实验都显示出了这种非理性行为。
  2. MNOSS 的结论被修正:MNOSS 说“没发现系统性效应”,是因为他们用的“估值测试”太容易受干扰,把真实的效应给掩盖了。
  3. 参数陷阱:作者还发现,如果你随便选几个数字做实验(比如赌注金额和概率),可能根本测不出“变卦”。这就像你想测“重力”,却选了一个在太空中做实验的地方。以前的研究之所以能测出来,是因为他们无意中选了“对”的参数(让赌局 A 和 B 的价值非常接近,让人纠结)。

5. 总结:这对我们意味着什么?

这篇论文就像是在说:

“别被 MNOSS 的新方法骗了。他们以为换了个更高级的测谎仪,结果那个测谎仪太敏感,把真话都过滤掉了。我们重新用一把**更结实、更抗干扰的尺子(强测试)**去量,发现人类确实还是那个‘不理性’的人类。阿莱悖论依然成立,我们依然会在‘稳赚’和‘博一把’之间反复横跳。”

一句话总结:
人类做决定时确实会“变卦”,之前的研究没错,MNOSS 的新方法虽然听起来很科学,但实际上因为太依赖假设而失效了。作者提出的**“强测试”**才是看清人类真实行为的“火眼金睛”。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →