Neural sampling from cognitive maps enables goal-directed imagination and planning

该论文提出了一种结合认知地图、随机计算和组合编码的透明神经网络模型,通过自监督局部突触可塑性实现了无需深度神经网络或大语言模型即可在低功耗边缘设备上进行的灵活目标导向想象与规划。

Lin, H., Yang, Y., Zhao, R., Pezzulo, G., Maass, W.

发布于 2026-04-03
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常迷人的想法:我们的大脑是如何用极少的能量(仅 20 瓦,相当于一个灯泡),就能瞬间学会新东西、规划复杂路线,甚至解决从未遇到过的问题的?

目前的超级人工智能(AI)虽然聪明,但非常“费电”,而且换个任务往往需要重新训练。作者们提出,大脑之所以这么高效,是因为它拥有三个秘密武器:认知地图随机采样组合式编码。他们把这些原理整合成了一个名为 GCML(生成式认知地图学习器) 的新模型。

为了让你更容易理解,我们可以把大脑的规划过程想象成在一个巨大的、看不见的“乐高城市”里寻找宝藏

1. 核心概念:大脑的“导航仪”与“想象力”

想象一下,你被困在一个陌生的城市里,手里只有一张地图(认知地图)。

  • 传统 AI 的做法:像是一个死记硬背的导游。它必须把每条路都跑一遍,记住哪里是死胡同,哪里是捷径。如果突然修路了(环境变了),它就得重新跑一遍所有路,非常慢且耗能。
  • 大脑(及 GCML)的做法:它不仅仅是一张静态地图,而是一个会动的、有想象力的导航仪

秘密武器一:认知地图 (Cognitive Maps)

这就好比大脑里有一个3D 全息投影的乐高城市

  • 在这个城市里,每一个地点(状态)和每一个动作(比如“向左转”、“拿一块积木”)都被编码成了位置。
  • 大脑不仅记录了“我去过哪里”,还记录了“如果我做这个动作,我会去哪里”。这就像你脑子里不仅知道家在哪里,还知道“如果我从家出发往东走,我会经过公园”。

秘密武器二:随机采样 (Stochastic Sampling)

这是最精彩的部分。当你要去一个从未去过的地方时,大脑不会只走一条死板的路。

  • 比喻:想象你在脑海里快速播放几十条可能的路线。就像你在脑海里“预演”:
    • 路线 A:直接冲过去,但好像前面有墙。
    • 路线 B:绕个弯,虽然远点,但很安全。
    • 路线 C:先退一步,再跳过去。
  • 这个过程是随机的(带点“混乱”),就像在脑海里撒了一把种子,看哪条路能发芽。这种“混乱”反而让大脑能跳出死胡同,找到意想不到的捷径。

秘密武器三:组合式编码 (Compositional Coding)

这是解决“从未见过的问题”的关键。

  • 比喻:乐高积木。你不需要为每一种可能的城堡都画一张新图纸。你只需要认识“墙”、“窗户”、“塔楼”这些基础积木。
  • 当你看到一个从未见过的奇怪形状(比如一只由积木拼成的山羊),大脑能迅速把它拆解成熟悉的积木组合。因为大脑理解了积木之间的组合规则,所以它能瞬间想象出如何把这只“积木山羊”拆掉,或者拼成一只“积木大象”。

2. 这个模型(GCML)是怎么工作的?

作者把这个过程做成了一个简单的数学模型,它不需要像现在的 AI 那样进行复杂的“反向传播”(一种极其耗能的训练方法)。

  • 学习过程(在线学习)
    想象一个小机器人(GCML)在房间里乱跑。它每走一步,就记下:“我往左走,看到了什么”。它不需要老师教,自己就能学会“动作”和“结果”之间的关系。这就像小孩子学走路,摔倒了就知道“往那边走会撞墙”。
  • 逆模型(Inverse Model)
    这是大脑的“直觉”。当你心里想“我要去那个红色的目标”,大脑不需要计算复杂的公式,而是直接产生一种方向感。就像你闭着眼睛也能凭感觉知道“往左走一点就能拿到杯子”。这个模型学会了一种能力:看到“现在的我”和“想要的目标”之间的差距,直接给出一个“往哪走”的指令。
  • 生成式想象(Generative Imagination)
    当没有真实环境反馈时(比如你在做梦或规划未来),GCML 会在脑海里模拟下一步会发生什么。它利用刚才学到的“方向感”,加上一点点随机的“噪音”(想象力),在脑海里快速生成几十条可能的路径,然后选出最好的一条。

3. 实验成果:它有多强?

作者用三个场景测试了这个模型:

  1. 老鼠的迷宫(2D 空间)
    模型成功模拟了老鼠在脑海里“回放”去家的路线。即使路上突然出现了新的障碍物,模型也能像老鼠一样,瞬间在脑海里绕开障碍,找到新路。这解释了为什么老鼠在睡觉时,大脑里会有各种奇怪的路线回放——那是在预演未来的逃生路线。

  2. 抽象的寻宝游戏(图论问题)
    在一个由 32 个点组成的抽象网络中,模型能瞬间找到从起点到终点的最短路径,甚至能找出“次短”的几条路。如果给某些点加上“奖励”(比如经过这里能加分),模型能灵活地调整路线去捡分,就像在玩游戏时根据局势改变策略。

  3. 最难的挑战:积木拼图(组合问题)
    这是最厉害的地方。模型被要求把复杂的剪影(由积木拼成)拆解成基础积木。

    • 训练时:它只见过由 5 块积木拼成的图。
    • 测试时:它面对的是由 8 块积木拼成的、从未见过的复杂图形。
    • 结果:它竟然成功了!因为它理解了积木的组合逻辑。它不需要重新学习,而是直接利用“方向感”在脑海里拆解。这就像你学会了拼 5 块积木的飞机,突然让你拼 8 块积木的火箭,你也能拼出来,因为你懂原理。

4. 为什么这很重要?

  • 省电:这个模型不需要超级计算机,甚至可以在手机芯片或微型机器人上运行。它只需要很少的能量,就能像人脑一样灵活。
  • 即时适应:现在的 AI 换个任务就要重新训练几个月。这个模型换个目标(比如从“去超市”变成“去学校”),只需要几秒钟就能重新规划。
  • 解决新问题:它能处理从未见过的情况,因为它不是死记硬背,而是理解事物的结构和关系

总结

这篇论文告诉我们,真正的智能不一定需要庞大的数据量和巨大的算力

大脑之所以强大,是因为它把世界看作一张动态的地图,利用想象力在脑海里快速试错,并利用组合逻辑举一反三。作者提出的 GCML 模型,就是试图把这种“生物智慧”装进简单的电路里,让未来的 AI 也能像人一样,用极少的能量,灵活地解决各种新奇难题。

简单来说,他们造出了一个会做梦、会预演、懂直觉的“小机器人”,它不需要死记硬背,就能在未知的世界里找到出路。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →