Learning to select computations in recurrent neural circuits

该研究通过结合理性元推理理论与元学习算法,构建了一个能够学习选择计算过程的循环神经网络模型,成功模拟了灵长类及人类在决策与规划任务中的行为特征和神经动力学,从而为大脑如何实现自适应认知控制提供了统一的机制性解释。

原作者: Chen, S., Callaway, F., Kumar, S., Lupkin, S. M., Wallis, J. D., McGinty, V. B., Rich, E. L., Mattar, M. G.

发布于 2026-04-16
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“大脑如何聪明地决定‘想什么’以及‘什么时候想’"**的故事。

想象一下,你站在电影院的爆米花摊前。你面临一个选择:买一大桶爆米花吗?

  • 你可以直接凭直觉买下来(行动)。
  • 你也可以回想上次吃的味道(回忆)。
  • 或者想象排队要多久(模拟)。
  • 甚至计算一下价格是否划算(计算)。

每一个“想”的动作(回忆、模拟、计算)都需要消耗你的时间和精力(就像手机耗电一样)。如果你什么都想一遍,你可能还没决定好,电影就开场了;如果你什么都不想,又可能买到了难吃的爆米花。

人类和聪明动物的厉害之处,就在于懂得在“想”和“做”之间找到完美的平衡。 这篇论文就是为了解开这个谜题:大脑到底是怎么学会这种“权衡”的?

1. 核心概念:把“思考”变成一种“行动”

研究人员做了一个非常有趣的假设:把“思考”也看作是一种“行动”

  • 普通行动:比如伸手去拿爆米花,这会改变外部世界(爆米花到了你手里)。
  • 思考行动:比如在大脑里“回放”上次的味道。这不会改变外部世界,但会改变你大脑内部的状态(让你更清楚该不该买)。

这就好比你的大脑里有一个**“超级管家”(前额叶皮层,PFC),它手里有一堆“信息工具”(海马体、记忆区等)**。管家可以决定:

  • 是直接去拿爆米花(行动)?
  • 还是先问管家:“上次味道咋样?”(调用记忆工具)
  • 或者问:“排队人多吗?”(调用模拟工具)

每次调用工具都要付“电费”(认知成本),但换来的信息能帮你做出更好的决定。

2. 他们做了什么?(造了一个“电子大脑”)

为了验证这个想法,作者们训练了一个人工智能(AI)模型。这个模型就像一个刚出生的婴儿,它不知道该怎么思考,只知道:

  1. 行动:选爆米花。
  2. 思考:调用工具获取信息(但这要花钱/扣分)。
  3. 目标:在有限的“电量”(时间/精力)下,吃到最香的爆米花(获得最大奖励)。

通过成千上万次的训练,这个 AI 学会了**“元学习”(Meta-learning),也就是“学习如何学习”**。它不再死板地执行任务,而是学会了根据情况灵活调整:

  • 如果问题很简单,它就不想太多,直接做。
  • 如果问题很复杂,它就愿意多花点“电费”去多调用几次工具,把信息算清楚。

3. 惊人的发现:AI 和人类、猴子长得太像了!

训练好之后,作者们把这个 AI 扔进几个不同的任务里,结果发现它表现得和人类、甚至猴子一模一样:

  • 在简单的选择任务中

    • 人类行为:当我们犹豫不决时,我们的眼睛会来回扫视不同的选项,而且会盯着那些“不确定”的选项看更久。
    • AI 表现:这个 AI 也学会了盯着那些“不确定”的地方看,而且它的内部运作模式(神经动态)和猴子大脑中负责决策的区域(眶额皮层)简直如出一辙。就像 AI 和猴子的大脑里都在上演着同样的“思想舞蹈”。
  • 在复杂的规划任务中

    • 人类行为:当我们要走迷宫或规划路线时,我们会像下棋一样,在脑海里一步步推演:“如果我走这里,下一步会怎样?”这叫**“心理模拟”**。
    • AI 表现:这个 AI 也学会了这种“推演”。它会在脑海里一步步模拟未来的路径,而且这种模拟的过程,竟然和人类大脑中海马体(负责记忆和空间)与前额叶皮层(负责规划)的互动模式完全吻合。

4. 这意味着什么?(通俗总结)

这篇论文最大的贡献是把两个原本分开的理论世界连在了一起

  1. 理性推理理论:认为人类是理性的,会计算成本收益。
  2. 机器学习理论:认为大脑是通过不断试错来学习的。

作者发现,“学会如何思考”其实就是“学会如何从自己的思考过程中学习”

  • 以前的观点:大脑里有个小人在指挥我们思考(这很荒谬,因为小人自己怎么思考呢?)。
  • 现在的观点:大脑是一个自我进化的系统。它通过不断的“尝试思考”和“评估思考的效果”,自己学会了什么时候该停下来,什么时候该继续想。

5. 一个生动的比喻

想象你的大脑是一个**“创业公司”**:

  • CEO(前额叶皮层):负责做最终决定。
  • 各部门(海马体、记忆区等):负责提供数据、做模拟、查资料。
  • 预算(认知资源):非常有限,不能无限期开会。

以前的理论认为,CEO 手里有一本写好的“操作手册”,告诉他在什么情况下该查什么资料。
但这篇论文告诉我们:没有操作手册! CEO 是通过**“试错”**学会的。

  • 有一次,CEO 查了太多资料,结果错过了商机(亏了)。
  • 另一次,他查得太少,决策失误(也亏了)。
  • 经过无数次这样的“创业演练”,CEO 终于学会了**“直觉”**:什么时候该叫停会议,什么时候该让财务部再跑一趟。

结论
这篇论文告诉我们,人类那种灵活、高效、能随时调整策略的聪明才智,并不是因为大脑里有一个全知全能的“神”,而是因为大脑学会了一套**“自我管理的算法”**。它知道如何分配有限的精力,在“想”和“做”之间找到最优解。这不仅解释了人类为何如此聪明,也为未来制造更聪明、更省电的 AI 提供了新的蓝图。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →