Active Inference with a Self-Prior in the Mirror-Mark Task

该研究提出了一种基于自由能原理的主动推断计算模型,通过引入由 Transformer 实现的“自我先验”机制,使模拟婴儿在无外部奖励的情况下,仅凭视觉与本体感觉的跨模态关联即可自发完成镜像自我识别任务,从而为自我意识的发育起源提供了统一的计算解释。

Dongmin Kim, Hoshinori Kanazawa, Yasuo Kuniyoshi

发布于 2026-04-14
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常有趣的故事:科学家给一个虚拟的“婴儿机器人”装上了一个特殊的“大脑”,让它在没有老师教、没有糖果奖励的情况下,自己学会了照镜子并擦掉脸上的贴纸。

我们可以把这项研究想象成教一个婴儿如何“认出”自己,但这次我们不是用语言,而是用数学和计算机代码。

以下是用通俗易懂的语言和生动的比喻来解释这篇论文的核心内容:

1. 核心问题:为什么看到镜子里的怪东西,就要伸手去摸?

传统的观点认为,机器人或婴儿必须被“编程”好:“如果你看到镜子里有个红点,那就伸手去摸它。” 或者需要有人告诉它:“那是你的脸,那个红点是脏东西,快擦掉。”

但这篇论文问了一个更深层的问题:如果没有人教,也没有外部奖励(比如擦掉贴纸后给个苹果吃),机器人是怎么自己产生“我要擦掉它”这个念头的?

2. 主角登场:特殊的“自我记忆库”(Self-Prior)

为了解决这个问题,作者给机器人装了一个叫**“自我记忆库”**(Self-Prior)的组件。

  • 比喻:它就像一本“我的日常相册”。
    想象一下,这个机器人每天都在照镜子,它的大脑里默默记录着:“哦,我的脸通常是这样的,我的手臂摆在这个角度时,镜子里的图像应该是那样的。”它把成千上万次“没有贴纸”的正常状态,都存进了这本相册里。

    这本相册不是一张张具体的照片,而是一个概率分布。简单说,它记住了“正常的我”长什么样。

3. 实验过程:贴纸出现了,大脑“报警”了

当研究人员在机器人的脸上贴了一个贴纸,并让它照镜子时,神奇的事情发生了:

  1. 发现异常: 机器人看着镜子里的自己,大脑里的“自我记忆库”立刻开始比对:“等等!现在的画面和相册里的‘正常我’对不上号!多了一个红点!”
  2. 产生不适感: 在数学上,这种“对不上号”被称为**“自由能”(Free Energy)很高**。你可以把它想象成一种**“认知上的瘙痒”“心理上的不协调感”**。就像你穿了一件反了的内裤,虽然没人告诉你,但你就是觉得不舒服,想把它弄正。
  3. 自发行动: 为了消除这种“瘙痒”(降低自由能),机器人本能地伸出手去摸那个红点。它的目标不是“擦掉贴纸”,而是**“让镜子里的画面重新变回我熟悉的、舒服的样子”**。

4. 关键突破:没有触觉,全靠“脑补”

最厉害的一点是,这个机器人没有触觉传感器。它摸不到贴纸,也感觉不到手碰到了脸。它完全靠眼睛(看镜子)本体感觉(知道手抬到了什么角度)

  • 比喻:就像你在黑暗中摸自己的鼻子。
    即使你闭着眼,你也知道鼻子在哪,因为你的大脑里有一个“身体地图”。这个机器人的“自我记忆库”就是一个跨感官的地图。它把“眼睛看到的图像”和“手臂的角度”联系在了一起。当它看到镜子里的异常,它不需要别人告诉它“那是你的脸”,它通过计算发现:“只有把手伸到这个位置,才能消除那个奇怪的视觉异常。”

5. 结果:它学会了!

经过训练,这个虚拟婴儿在**70%**的情况下成功擦掉了贴纸。

  • 擦掉前: 镜子里的异常让它很“焦虑”(自由能高)。
  • 擦掉后: 画面变回熟悉的“无贴纸状态”,焦虑消失(自由能降低)。

这证明了,“自我意识”可能不需要复杂的逻辑推理,只需要一个能够记住“我是谁”的模型,当现实与记忆不符时,行动就会自然发生。

6. 总结与启示

这项研究就像是在给“我是谁”这个哲学问题写代码。

  • 以前的模型: 像是给机器人装了一个“贴纸检测器”程序,告诉它“看到红点就动手”。
  • 现在的模型: 像是给机器人装了一个“自我感”。它不需要知道什么是“贴纸”,它只知道“现在的样子不像我”,于是它动手去修正,直到“现在的样子又像我了”。

这对我们有什么意义?
它暗示了人类婴儿的自我意识可能也是这样诞生的:我们并不是天生就知道“那是我的脸”,而是通过无数次体验,大脑记住了“正常的我”是什么样。当镜子里出现异常(比如涂了口红),那种“不对劲”的感觉驱使我们去探索,最终让我们意识到:“哦,原来那个镜子里的人是我。”

这篇论文用一种简洁的数学原理(自由能最小化),解释了生命体如何从单纯的感知中,自发地涌现出“自我”的雏形。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →