Equilibrium Propagation for Non-Conservative Systems

本文提出了一种框架,通过修改学习阶段的动力学过程以应对非互易相互作用,将平衡传播(Equilibrium Propagation)扩展到任意非保守系统,从而实现了代价函数梯度的精确计算,并取得了优于以往方法的性能。

原作者: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

发布于 2026-06-02
📖 1 分钟阅读🧠 深度阅读

原作者: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

大局观:无需“反向传播”的机器教学法

想象一下,你正试图教一个机器人识别照片中的猫。在目前主流的做法中(称为“反向传播”),机器人观察照片,做出猜测,意识到错误后,再将“纠错信号”一层一层地传回大脑,直到最开始的环节以修正错误。

问题在于,这种“反向传播”过程很难在真实的物理机器(如生物大脑或硅芯片)中实现,因为它需要信息在时间上或空间上进行即时的、逆向的传输。

**平衡传播(Equilibrium Propagation, EP)**是一种更聪明、更符合物理规律的学习方式。它不需要反向传播,而是让机器人进入一种“平静状态”(平衡态)。它尝试两种略微不同的情景:

  1. 自由状态(Free State): 机器人自然地观察图片并做出猜测。
  2. 扰动状态(Nudged State): 有人轻轻地将机器人的最终猜测向正确答案的方向推一把。

通过比较机器人在这两个平静状态之间大脑的变化,它就能弄清楚该如何调整内部设置,以便下次做得更好。这就像是通过感受“我原本以为的”与“被推向后的想法”之间的差异来进行学习。

问题所在:“对称性”规则

这种学习方法的原始版本(EP)仅适用于遵循严格规则——对称性的系统。

想象一个像球在光滑山坡上滚动这样的保守系统。如果球从 A 点滚到 B 点,它的路径是由山坡的形状决定的。如果你反转路径,物理特性是一样的。在计算机大脑中,这意味着如果神经元 A 与神经元 B 通信,那么神经元 B 与神经元 A 通信的强度也必须完全相同。

然而,许多现实世界的系统(以及现代 AI 模型)并不像平滑的山坡。它们更像是带有水流的河流单行道

  • 非保守系统(Non-Conservative Systems): 信息是单向流动的(例如在前馈网络中,数据流向为:输入 \rightarrow 隐藏层 \rightarrow 输出,但绝不回流)。
  • 问题在于: 旧版的 EP 方法在这些系统中会失效。它试图用处理“山坡”的数学逻辑去处理“河流”,导致学习计算出现偏差。机器人学到了错误的教训。

解决方案:两种新方法

作者提出了两种新方法来解决这个问题,使“平衡传播”法能够应用于这些单向、非对称的系统。

1. 非对称 EP (AsymEP):局部修正法

想象你在尝试平衡一个天平,但有人一直在偷偷地在其中一侧增加重量(即非对称部分)。旧的方法只是忽略这一点并试图强行平衡,结果注定失败。

AsymEP 在天平上增加了一个微小的、局部的“配重块”。

  • 运作方式: 在“扰动”阶段(即机器人被推向正确答案时),算法会加入一个特殊的修正项。这个项是根据连接的“不对称程度”精确计算出来的。
  • 类比: 这就像一名骑着爆胎自行车的骑手。旧的方法只是告诉他们用力蹬车。AsymEP 则是在车把上增加了一个微小的局部调整,以补偿爆胎的影响,从而让他们能骑得笔直且学习正确。
  • 结果: 这使得系统即使在连接是单向的情况下,也能计算出精确正确的梯度(即正确的教训)。

2. Dyadic EP:双脑法

如果说 AsymEP 是局部修正,那么 Dyadic EP 则是一种更大的架构变革。

  • 类比: 想象你拥有一台复杂的机器,它只有在有两个完全相同的副本并排运行的情况下才能工作。一个副本代表“前向”流动,另一个代表“后向”流动。
  • 运作方式: 该算法将系统的变量数量翻倍。它创建了一个新的、更大的“能量景观”,其中两个副本相互作用。在这个翻倍后的空间里,原系统中混乱的、单向的河流重新转化为了平滑且对称的山坡。
  • 结果: 因为现在的数学运算是在这个“翻倍”后的系统上进行的,所以学习变得完美。这有点像利用镜子让单行道看起来像双向道,从而可以应用标准的交通规则。

实验测试

作者不仅做了数学推导,还在真实的图像识别任务(如识别手写数字或衣物)上测试了这些想法。

  1. 对称起点: 他们从对称网络(类似于旧版 EP)开始。AsymEP 比旧方法学得更快,结果也更好。
  2. 强制非对称: 他们强迫网络呈现高度“单向”(高度非对称)的状态。
    • 旧的方法(向量场法/Vector Field)表现糟糕,结果几乎和随机猜测没区别。
    • AsymEP 依然表现完美,即使在网络完全是单向的情况下也能正常工作。
  3. 前馈网络: 这是最大的胜利。现代 AI(如手机中的 AI)通常是“前馈”的(严格单向)。旧的 EP 完全无法训练这些网络。AsymEP 成功训练了这些网络,证明它可以处理现代 AI 中使用的架构。
  4. 深度学习: 他们在复杂的 CIFAR-10 数据集上测试了一个深度网络。AsymEP 和 Dyadic EP 的表现几乎与标准的“反向传播”方法(即行业金标准)不相上下。

总结

  • 问题: 酷炫的“平衡传播”学习法只能作用于对称系统,但现实中的 AI 和物理系统通常是非对称的(单向的)。
  • 修复方案: 作者创造了 AsymEP(为学习规则增加了局部修正)和 Dyadic EP(通过将系统规模翻倍来使数学逻辑成立)。
  • 结果: 这些新方法让这种基于“物理”和“类脑”的学习风格能够应用于现代 AI 类型的网络,其效果与那些难以实现的标准方法一样出色。

简而言之,他们找到了如何在即便机器内部线路是严格单向的情况下,依然通过“弛豫(放松)”和“局部扰动”来教导一台物理机器的方法。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →