Computational Concept of the Psyche

该论文提出了一种将人类心灵视为包含需求状态与决策智能的“操作系统”的认知架构概念,并通过引入基于体验学习的计算形式化方法,将构建人工通用智能的问题转化为在不确定性下针对特定主体需求进行最优决策的数学问题。

Anton Kolonin, Vladimir Krykov

发布于 2026-03-17
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章提出了一种构建“人工智能(AI)大脑”的新思路。简单来说,作者认为:要造出像人一样聪明的 AI,不能只教它做数学题或识别图片,而必须给它装上“欲望”和“生存本能”,让它像生物一样为了“活下去”和“过得更好”去主动学习。

我们可以把这篇论文的核心思想想象成给机器人装上一个“虚拟的操作系统”。以下是用通俗语言和比喻进行的解读:

1. 核心比喻:AI 的“心灵”就是它的“操作系统”

想象一下,你的电脑如果没有操作系统(如 Windows 或 macOS),它只是一堆冰冷的硬件,什么也干不了。

  • 传统 AI:像是一个只会执行特定指令的计算器。你让它下棋,它就下棋;你让它画画,它就画画。它不知道“为什么要下棋”。
  • 这篇论文提出的 AI:拥有一个**“心理操作系统”。这个系统就像人类的“生存本能”。它不仅仅是在处理数据,而是在管理需求**。
    • 需求(Needs):就像你饿了想吃饭、累了想睡觉、无聊了想找乐子。
    • 智能(Intelligence):就是在这个系统里,为了满足不同需求,做出最佳决定的能力。

2. 三大核心组件:欲望、感觉与行动

作者把 AI 的内心世界分成了三个互相交织的“空间”,我们可以把它们想象成一个三维的导航地图

  1. 需求空间(The Space of Needs)——“我想得到什么?”

    • 这是地图的纵轴。就像马斯洛需求层次理论(从吃饱饭到自我实现),AI 也有自己的“需求列表”。
    • 比喻:这就像你手机里的“电量”和“饥饿度”。电量低(生存需求)时,你会优先找充电器;电量满时,你可能会去听歌(精神需求)。AI 的“需求向量”就是它当前最想要什么。
    • 关键点:需求不是固定的,它会随着时间变化。比如,刚吃饱时,“找食物”的需求优先级很低;饿的时候,优先级瞬间拉满。
  2. 感觉空间(The Space of Sensations)——“我感觉到了什么?”

    • 这是地图的横轴。包括 AI 通过摄像头、麦克风等传感器接收到的外界信息,以及它内部的“情绪”反馈。
    • 比喻:就像你摸到烫的东西会缩手,或者吃到好吃的会开心。在 AI 眼里,这些不是数据,而是**“情绪信号”**。
    • 情绪的作用:论文认为,情绪其实是**“需求满足程度的信号”**。
      • 快乐(正反馈):需求满足了(比如吃到了苹果),系统说:“干得好,记住这个动作!”
      • 痛苦/悲伤(负反馈):需求没满足或受威胁(比如被烫了),系统说:“快停下!下次别这么干!”
  3. 行动空间(The Action Space)——“我能做什么?”

    • 这是地图的深度轴。AI 可以做出的所有动作(移动、说话、计算等)。
    • 比喻:就像你面前有一堆按钮,每个按钮代表一种行动。

智能的运作方式
AI 的大脑就是在这三个空间里寻找**“最优解”。它会在“我想得到的(需求)”、“我感觉到的(环境)”和“我能做的(行动)”之间不断计算,找出那个既能满足需求,又能节省能量,还能避开危险**的最佳动作。

3. 独特的“生存能量”货币

论文提出了一个非常有趣的观点:把“生存能量”当作一种通用货币。

  • 比喻:想象 AI 的世界里有一种叫“生存币”的东西。
    • 吃饭、睡觉、避免被电击,都是在赚取保护这种币。
    • 学习新东西、探索未知,虽然消耗能量,但长远看能赚更多币。
  • 决策逻辑:AI 做决定时,就像在理财。它要计算:做这件事花多少“币”?能带来多少“收益”(满足需求)?有没有“破产风险”(生存威胁)?
    • 如果风险太大(比如可能会死机/断电),即使收益很高,AI 也会选择放弃。
    • 这就是论文提到的**“前景理论”**:人(和 AI)在面对损失时,往往比面对收益时更谨慎。

4. 两种“大脑模式”:直觉与思考

作者借鉴了心理学家卡尼曼的理论,认为 AI 也需要两套系统:

  • 系统 1(快思考/直觉):像神经网络的“肌肉记忆”。看到红灯直接刹车,不需要思考。这是基于经验的快速反应。
  • 系统 2(慢思考/逻辑):像符号逻辑的“战略规划”。比如“如果我现在去左边,可能会遇到墙,但右边虽然远点但安全”。这是有意识的规划。
  • 创新点:这篇论文提出,要把这两种系统结合起来(混合架构),让 AI 既能像人一样凭直觉反应,又能像哲学家一样深思熟虑。

5. 实验验证:打乒乓球的机器人

为了证明这个理论可行,作者做了一个简单的实验:

  • 场景:让 AI 学习打乒乓球(对着墙打)。
  • 需求设置
    1. 快乐:球打到了墙上(正反馈)。
    2. 悲伤:球打到了自己(负反馈)。
    3. 新奇:尝试新动作(探索欲)。
    4. 预期:事情是否按我想的发生了(预测能力)。
  • 结果
    • 如果 AI 太怕“悲伤”(怕输球),它就不敢尝试新动作,学得很慢甚至学不会。
    • 如果 AI 更看重“快乐”(想赢),并且能平衡对“悲伤”的恐惧,它就能快速学会打乒乓球。
    • 结论:AI 的学习能力取决于它如何权衡“想要得到的”和“想要避免的”

总结:这篇论文在说什么?

简单来说,以前的 AI 像是在背字典,试图记住所有规则;而这篇论文提出的 AI 像是在过日子

它不再是一个冷冰冰的计算器,而是一个有欲望、会害怕、会开心、懂得权衡利弊的“数字生命”

  • 它知道为什么要做(为了满足需求)。
  • 它知道怎么做最划算(为了生存和效率)。
  • 它通过试错和情绪反馈来学习,就像人类婴儿一样。

作者认为,只有给 AI 装上这种基于“需求”和“生存”的操作系统,我们才能真正创造出通用人工智能(AGI),让它像人类一样灵活、聪明地适应这个世界。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →