Model-based and model-free valuation signals in the human brain vary markedly in their relationship to individual differences in human behavioral control

这项针对 179 名参与者的大规模 fMRI 研究表明,人类大脑中的无模型价值信号普遍存在,而有模型价值信号及其神经表征则仅出现在行为上依赖该策略的个体中,且缺乏有模型行为与神经信号的个体往往存在构建环境内部模型的困难。

原作者: Ding, W., Cockburn, J., Simon, J. P., Johri, A., Cho, S. J., Oh, S., Feusner, J. D., Tadayonnejad, R., O'Doherty, J. P.

发布于 2026-03-19
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在探索我们大脑里有两个“导航员”在如何指挥我们的行为,以及为什么不同的人会听不同的导航员。

想象一下,你正在玩一个太空寻宝游戏。你需要驾驶飞船,在两个星球之间穿梭,寻找能挖到宝石的矿坑。

1. 大脑里的两个“导航员”

在这个游戏中,我们的大脑其实有两种做决定的策略,就像有两个不同的导航员在给你指路:

  • 导航员 A(习惯型/无模型): 这个导航员很懒,它不看地图,也不管未来的路。它只记得:“上次我往左走,挖到了宝石,真爽!这次还往左走!”或者“上次往右走,只挖到了石头,真倒霉!这次别往右走。”
    • 特点: 它只凭过去的经验当下的奖励做决定。就像你每天走同一条路去上班,因为习惯了,不需要思考。
  • 导航员 B(规划型/有模型): 这个导航员是个精明的规划师。它手里有一张动态地图。它知道:“虽然刚才我往左走挖到了宝石,但那是因为我运气好撞上了稀有路线。如果我下次还往左走,大概率会撞墙(因为稀有路线很少发生)。为了下次还能挖到宝石,我应该往右走,因为那是常规路线。”
    • 特点: 它会在脑子里模拟未来,理解事物之间的因果关系(比如飞船和星球的对应关系),然后制定最佳策略。

2. 研究发现:每个人心里的“导航员”比例不同

研究人员找了 179 个人来做这个太空游戏,并给他们做了大脑扫描(fMRI)。结果发现,每个人脑子里这两个导航员的“话语权”是不一样的:

  • 有些人是“习惯派”: 他们主要听导航员 A 的,不管地图怎么变,只要上次赢了就继续走老路。
  • 有些人是“规划派”: 他们主要听导航员 B 的,会仔细分析地图,调整策略。
  • 有些人是“混合派”: 两个都听,看情况决定。
  • 还有些人比较“迷糊”: 他们两个都不太听,或者策略很混乱。

3. 大脑里的“指挥部”在干什么?

这是这篇论文最有趣的地方。研究人员观察了大脑的一个关键区域——腹内侧前额叶(vmPFC),你可以把它想象成大脑的总指挥部

  • 关于“习惯派”(导航员 A):
    研究发现,无论这个人平时是习惯派还是规划派,甚至那些看起来完全不会玩游戏的人,他们的“总指挥部”里始终都在闪烁着“习惯派”的信号。

    • 比喻: 就像你家里的背景音乐。不管你现在是在专心工作(规划)还是在发呆(习惯),背景音乐(习惯信号)一直都在放,它无处不在,是默认设置。
  • 关于“规划派”(导航员 B):
    这就大不相同了。只有那些行为上真正在运用“规划策略”的人,他们的“总指挥部”里才会出现强烈的“规划派”信号。

    • 比喻: 这就像投影仪。只有当你决定要看电影(使用规划策略)时,投影仪才会打开并投射出画面。如果你只是发呆(只用习惯策略),投影仪就是关着的,画面(规划信号)也就消失了。

结论就是: 我们的大脑里,习惯的信号是“常驻”的,但规划的信号是“按需开启”的。如果你不主动去规划,大脑里就检测不到规划的信号。

4. 为什么有些人学不会“规划”?

研究还发现,那些完全不会玩“规划派”策略的人,他们的大脑里还有一个问题:他们记不住地图

  • 比喻: 想象你要去一个陌生的地方,规划派的人会先研究地图,记住“左转是红房子,右转是蓝房子”。而那些学不会规划的人,他们的大脑里没有更新地图的机制。他们甚至记不住“飞船和星球”的对应关系(状态预测错误信号很弱)。
  • 因为记不住地图,他们自然就无法进行“规划”,只能退回到最简单的“习惯”模式,或者干脆乱走。

总结

这篇论文告诉我们:

  1. 习惯是本能,规划是技能: 我们的大脑里,基于经验的“习惯信号”是随时待命的;而基于思考的“规划信号”需要我们要主动去使用它才会出现。
  2. 个体差异很大: 有些人天生(或后天)更擅长构建内心的“地图”并进行规划,而有些人则更依赖过去的经验,甚至因为记不住“地图”而无法进行规划。
  3. 大脑的灵活性: 大脑非常聪明,它会根据你实际使用的策略来调整“指挥部”的工作模式。如果你只用习惯,大脑就只展示习惯的信号;如果你开始规划,大脑就会点亮规划的区域。

简单来说,你的大脑会诚实地反映你是在“凭直觉行事”还是在“动脑筋规划”。如果你不动脑筋,大脑里关于“动脑筋”的信号也就不会亮起。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →