Accumulation of neural state transitions in dorsomedial striatum predicts patch foraging decisions

本研究证明,小鼠背内侧纹状体中的神经元通过一种奖励重置、累积至阈值的机制来编码斑块觅食决策,该机制整合了自上次奖励以来经过的时间和环境奖励率,以确定何时放弃正在枯竭的资源。

原作者: Sutlief, E., Zhang, S., Forsberg, K., Shuler, M. G. H.

发布于 2026-05-06
📖 1 分钟阅读☕ 轻松阅读

原作者: Sutlief, E., Zhang, S., Forsberg, K., Shuler, M. G. H.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象你身处一个无限取餐的自助餐厅。你面前有一盘美味的食物,但你知道它并非取之不尽。在某个时刻,你必须做出决定:我是继续吃这道菜,还是起身去寻找新的菜品?

这正是这篇论文中科学家研究的核心问题。他们旨在理解大脑如何决定何时停止从事那些回报(如食物)随时间推移而变得愈发难以获取的活动。

以下是他们发现内容的简明解析:

大脑的“奖励重置”按钮

研究人员聚焦于小鼠大脑中一个微小而特定的区域,称为背内侧纹状体(简称 DMS)。可以将该区域视为大脑的“决策计时器”。

当小鼠发现奖励(例如在食物“斑块”中找到美味零食)时,其大脑中会发生一些有趣的现象:

  1. 重置:每当小鼠获得奖励时,DMS 中的一组特定神经元就会按下“重置按钮”。
  2. 倒计时:重置之后,这些神经元立即开始倒计时。它们并非随机滴答作响,而是遵循非常特定的节奏。
  3. 铺排:想象一场接力赛,不同的选手在不同时间起跑。在小鼠大脑中,不同的神经元在获得奖励后的不同时刻启动各自的“倒计时”。有些立即开始滴答,有些在一秒后开始,还有些在两秒后开始。它们共同覆盖了整个时间线,形成一个连续的信号,精确追踪自上次获得零食以来经过的时间。

“累积”计量表

随着时间流逝且未获得新奖励,这些神经元会累积信号,如同水桶注水。

  • 等待的成本:大脑知道等待过久是“昂贵”的,因为小鼠本可以在其他地方找到食物。如果环境食物丰富(高奖励率),大脑会更快变得不耐烦;如果食物稀缺,大脑则会等待更久。
  • 阈值:桶中的“水”持续上升,直到触及特定的“溢流线”(阈值)。
  • 决策:一旦“水”触及该线,小鼠便会决定:“好吧,自上次进食以来我已等待足够久。是时候离开这个斑块,去寻找新的了。”

全局图景

该论文主张,小鼠并非仅仅在猜测或用秒表数秒。相反,其大脑正在运行一种复杂的计算:

  • 它追踪自上次奖励以来已过去的时间
  • 它根据当前环境中时间的价值(食物是容易找到还是难以找到?)来调整这一计时器。
  • 它利用一组按顺序放电的神经元团队来测量这一时间。
  • 当信号达到特定极限时,小鼠便会停止并转向其他目标。

简而言之,背内侧纹状体充当一个智能且可调节的计时器,帮助动物精确知晓何时放弃某项任务以最大化其成功率,确保其不会在“干涸”的斑块上浪费时间,而附近可能正有更好的机会。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →