Dynamic distortion of inferred reward probability shapes choice over time

该研究通过形式化将选择视为对时间和奖励概率不确定性的推断问题,揭示了人类在动态奖励环境中虽趋近最优但仍存在对推断奖励概率的系统性扭曲,并发现了奖励概率而非单纯时间流逝会调节时间不确定性的两个关键计算原则。

Grabenhorst, M., Maloney, L. T.

发布于 2026-04-10
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文研究了一个非常有趣的问题:当我们面对不确定的未来时,大脑是如何根据“时间”和“奖励”来做决定的?

想象一下,你正在玩一个游戏,或者在现实生活中面临一个选择:是现在行动,还是再等一等?

🎮 核心场景:一场“时间赛跑”

研究人员设计了一个简单的游戏:

  1. 开始信号:屏幕上出现一个“准备”信号(比如两个棋盘格)。
  2. 等待:你需要等待一段时间。这段时间是随机的,短则 0.4 秒,长则 1.4 秒。
  3. 行动信号:当“开始”信号变成“行动”信号(棋盘格翻转)时,你必须立刻按左键或右键。
  4. 奖励规则
    • 按左键:如果按得,奖励概率高;按得,奖励概率低。
    • 按右键:如果按得,奖励概率高;按得,奖励概率低。
    • 关键点:在某个特定的时间点,左右两边的奖励概率正好各占 50%。在这个点之前,选左边划算;过了这个点,选右边划算。

挑战在于:游戏过程中没有任何提示告诉你现在具体过了几秒。你必须靠内心的时钟来估算时间,并据此判断现在选哪边更可能赢钱。


🧠 大脑的两个“秘密武器”

研究人员发现,人类的大脑在处理这种“时间 + 奖励”的复杂任务时,并没有像教科书里说的那样完美,而是用了两个非常聪明的(但有点“歪”的)策略:

1. 策略一:把“可能性”变成“更极端的决定” (动态扭曲)

通俗解释
假设你心里算出“现在选左边有 60% 的把握赢”。

  • 理性的做法:既然有 60% 把握,那你就按 60% 的频率去选左边(比如 10 次里有 6 次选左)。
  • 大脑的实际做法:大脑觉得"60% 还不够稳”,于是它把这种感觉放大了。它把 60% 的把握“扭曲”成了 80% 甚至 90% 的把握。
    • 如果把握是 30%,大脑会觉得“这太危险了”,于是几乎不选。
    • 如果把握是 70%,大脑会觉得“这很稳”,于是几乎全选。

🌰 比喻
这就像你在看天气预报。

  • 客观事实:明天有 60% 的概率下雨。
  • 你的大脑:把它扭曲成“肯定会下雨!”或者“完全不会下雨!”。
  • 结果:你要么带伞,要么不带伞,很少会“半带半不带”。
    研究发现,大脑通过这种**“非黑即白”的放大机制**,虽然损失了一点点理论上的完美分数,但能让我们在面对模糊信息时,做出更果断、更高效的决定。

2. 策略二:重要的时刻,时间感更精准 (奖励驱动的时间感)

通俗解释
传统理论认为,时间过得越久,我们对时间的感觉就越模糊(就像韦伯定律说的,时间越长,误差越大)。
但这篇论文发现:不是这样的!

大脑对时间的精准度,不取决于“过了多久”,而取决于**“那个时刻有多重要(奖励多高)”**。

  • 当某个时间点奖励很高(比如正好是左右切换的关键点附近),大脑的“内部时钟”会突然变得超级精准,像高清摄像机一样。
  • 当某个时间点奖励很低(比如刚开始或快结束时,选哪边都差不多),大脑的“内部时钟”就会变得模糊,像开了美颜滤镜一样,时间感变得很随意。

🌰 比喻
想象你在看一场足球赛。

  • 比赛刚开始(0 分钟):进球概率低,你看得很放松,甚至可能看手机,对时间的流逝感觉模糊。
  • 比赛最后 1 分钟(绝杀时刻):进球概率极高,奖励巨大!这时候你的眼睛瞪得大大的,每一秒都感觉被拉长了,你的时间感变得极度敏锐
  • 结论:大脑会根据“利益”来调节时间的分辨率。越重要的时刻,时间越清晰。

💡 总结:我们是如何做决定的?

这篇论文告诉我们,人类在做决定时,并不是像计算机那样冷冰冰地计算概率。我们的大脑是一个**“智能的扭曲者”**:

  1. 它会把模糊的概率“ sharpen"(锐化):把模棱两可的感觉变成坚定的行动,让我们不再犹豫不决。
  2. 它会根据“利益”来调节时间感:在关键时刻,它会调动所有资源让时间感变得精准;在无关紧要的时刻,它就“摸鱼”放松。

一句话总结
当我们面对不确定的未来时,大脑不会死板地等待完美信息,而是主动地“脑补”和“放大”,把模糊的时间线索变成清晰的行动指南,并且只在最有价值的时刻才开启“超高清时间模式”。这是一种为了在复杂世界中生存而进化出的高效生存策略。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →