Stimulus prior and reward probability differentially affect response bias in perceptual decision making

该研究通过五项大鼠听觉辨别实验发现,奖励比例对决策偏好的影响显著强于刺激呈现比例,且现有基于检测理论、匹配律和强化学习的模型均无法解释这种差异,表明受试者可能显式地表征了先验刺激概率或完整的刺激分布。

Koss, C., Blanke, J.-H., de la Cuesta-Ferrer, L., Jakel, F., Stuttgen, M. C.

发布于 2026-02-17
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在研究大老鼠是如何做决定的,特别是当它们面对“猜声音”游戏时,是如何调整自己的“赌注”策略的。

为了让你更容易理解,我们可以把这项研究想象成在一个充满噪音的赌场里玩老虎机

1. 核心故事:老鼠的“猜谜游戏”

想象一下,你是一只老鼠,面前有两个按钮(左和右)。

  • 机器会播放两种不同的声音(比如高音和低音)。
  • 如果你听到高音就按左键,听到低音就按右键,就能得到水喝(奖励)。
  • 但是,机器有时候会“作弊”:
    • 情况 A(刺激概率): 它故意多放高音,少放低音。
    • 情况 B(奖励概率): 它虽然放的声音一样多,但按左键赢水的几率大,按右键赢水的几率小。

老鼠的目标是什么? 当然是喝到最多的水。
老鼠该怎么做? 它需要调整自己的“心理门槛”(决策标准)。

  • 如果高音经常来,老鼠就会想:“反正高音多,我干脆多按左键,哪怕猜错了也无所谓,因为猜对的机会大。”
  • 如果按左键更容易赢水,老鼠也会想:“不管声音是什么,我都要多按左键,因为这样更划算。”

2. 科学家发现了什么?(主要结论)

科学家做了五个实验,想看看这两种“作弊”方式(声音多 vs. 赢钱多)对老鼠的影响是不是一样的。结果发现了一个非常有趣的**“双标”现象**:

🏆 结论一:钱(奖励)比声音(概率)更有说服力

  • 比喻: 想象你在玩一个游戏。
    • 场景 1: 游戏里“石头”出现的频率是“剪刀”的 4 倍。
    • 场景 2: 游戏里“石头”和“剪刀”出现频率一样,但出“石头”赢 4 块钱,出“剪刀”只赢 1 块钱。
  • 结果: 老鼠在场景 2(奖励不同)里,改变得快得多、彻底得多!它们会疯狂地偏向那个能赢更多钱的选择。
  • 而在场景 1(只是声音多)里,老鼠虽然也会调整,但调整得慢吞吞、不情愿。它们似乎觉得:“哦,那个声音多,但我还是得仔细听听,不能太随便。”
  • 科学解释: 老鼠的大脑里,“奖励”的学习速度是“声音频率”学习速度的 10 倍以上!就像是你听到有人喊“有免费午餐”(奖励)时,你会立刻冲过去;但听到“今天下雨概率大”(声音频率)时,你可能只是稍微带把伞,反应没那么剧烈。

🤯 结论二:当“声音多”和“钱多”打架时,钱赢了

在第三个实验里,科学家故意让两者“对着干”:

  • 让“高音”出现得特别多(比如 4 次),但按左键(对应高音)赢钱的几率却很低。
  • 让“低音”出现得少(比如 1 次),但按右键(对应低音)赢钱的几率很高。
  • 结果: 老鼠完全无视了声音的频率,死死地追着高奖励跑。它们不管那个声音多不多见,只要按那个键能喝到水,它们就按那个键。
  • 这意味着: 老鼠的大脑并不是简单地计算“哪个声音多”,它们似乎明确地知道“哪个选择回报更高”,并且这个信息压倒了“哪个声音更常见”。

💧 结论三:水的总量(奖励密度)不重要

科学家还测试了:如果每次赢水的概率都很低(比如只有 10% 能赢),或者很高(比如 90% 能赢),老鼠的学习速度会变吗?

  • 结果: 不会。 不管水多难喝到,还是很容易喝到,老鼠调整策略的速度都是一样的。
  • 比喻: 就像你学骑自行车。不管路上坑多坑少(奖励密度),你学会平衡的速度主要取决于你摔了多少次(奖励的比率),而不是路上坑的总数。

3. 为什么现有的“电脑模型”都失败了?

科学家用了三种流行的数学模型(就像三种不同的“大脑模拟器”)来预测老鼠的行为:

  1. 模型 A(信号检测论): 假设老鼠只是机械地调整门槛。
  2. 模型 B(匹配定律): 假设老鼠根据过去的奖励比例来分配行为。
  3. 模型 C(强化学习): 假设老鼠像玩电子游戏一样,通过试错来更新“动作价值”。

尴尬的是: 这些模型在老鼠只面对“声音多”或只面对“钱多”时,还能勉强猜对。但一旦让两者打架(实验 3),这些模型就彻底懵了

  • 原因: 这些模型都假设老鼠是“瞎子”,它们不知道声音出现的概率(先验概率),只记得“按这个键赢了多少次”。
  • 真相: 老鼠其实心里有本账!它们不仅记得“按左键赢了多少次”,还记得“高音出现了多少次”。它们把这两条信息结合起来,做出了更聪明的决定。现有的模型因为没把“声音出现的概率”算进去,所以算不准。

4. 总结与启示

这篇论文告诉我们:

  • 老鼠(甚至人类)在做决定时,对“奖励”的反应比对“概率”的反应要敏感得多、快得多。
  • 我们的大脑不仅仅是在统计“过去发生了什么”,我们似乎明确地知道“哪种情况更可能发生”以及“哪种选择更划算”,并且这两者在大脑里是分开处理的。
  • 未来的 AI 或心理学模型,如果想要真正模拟生物的智慧,就不能只盯着“奖励”看,必须把“对世界概率的感知”也加进去。

一句话总结:
老鼠不是只会数数的计算器,它们更像是精明的赌徒:如果赢钱的几率变了,它们会立刻改主意;如果只是某种声音变多了,它们只会稍微动一动念头。而且,它们心里清楚这两种变化的区别,现有的简单模型还学不会这一招。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →