Integrating Out, Twice:The Open-System Case That Neural-Network Ensemble Theory Is Missing

本文建立了一个将封闭系统神经网络集成与核反应理论中的开放系统类比进行比较的理论框架,并最终得出结论:由于缺乏连续谱和波动行为,后者独特的非厄米动力学在主流学习中结构性地缺失,从而将运行不确定性的真正来源定位在封闭系统的对应关系之中。

原作者: Jin Lei

发布于 2026-06-10
📖 1 分钟阅读🧠 深度阅读

原作者: Jin Lei

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

核心思想:两种“忽略”的方式

想象你正在试图理解一个复杂的系统,比如一个拥挤的房间或一个神经网络(一种人工智能类型)。有时,你无法追踪每一个人或每一个数字。你必须决定去忽略系统的一部分,以便专注于你关心的部分。

在物理学和数学中,这种“忽略”或“积分掉”(integrating out)系统一部分的行为是一种标准做法。作者 Jin Lei 认为,这种做法有两种截然不同的方式:虽然 AI 研究者主要使用其中一种,但核物理学家已经精通了另一种。

1. “封闭式”方法(AI 所做的)

类比: 想象你正在给一群朋友拍照,但你决定把背景模糊处理。

  • 发生了什么: 你失去了背景的细节,但你朋友的照片依然保持清晰且“完整”。模糊处理并没有偷走你朋友的光线或能量;它只是移除了背景数据。
  • 在 AI 中: 当 AI 研究者对神经网络中的随机数字(参数)进行平均化处理时,他们得到的是一个“封闭”的结果。数学保持简单、真实且对称。这是一种无损的总结。没有任何东西“逃逸”。

2. “开放式”方法(核物理所做的)

类比: 想象你在一个门虚掩着的房间里。你正在尝试追踪房间内的空气压力。

  • 发生了什么: 空气通过门缝漏了出去。如果你试图仅通过描述房间“内部”的空气来建模,你的描述必须考虑到空气正在流失的事实。数学会变得“有泄露性”且复杂。你必须建立一份严格的账本(收据),记录究竟有多少空气逃逸以及去了哪里。
  • 在核物理中: 这被称为光学模型(Optical Model)。当原子核与粒子发生相互作用时,一些粒子会逃逸到“连续谱”(the continuum,即宇宙的其余部分)。描述原子核的数学变得是“非厄米(non-Hermitian)”的(这是一个高级说法,意指它是复杂且有泄露性的)。至关重要的是,数学中包含了一个通量账本(Flux Ledger):一份关于离开系统的概率之精确统计。

论文的核心观点

作者说:“AI 只在做‘封闭版’。它缺失了‘开放版’。”

AI 研究者拥有一套优秀的词典,用于在他们的“封闭”数学与核物理之间进行翻译。例如:

  • 神经切线核(Neural Tangent Kernel,AI 如何学习) 等同于 费舍尔敏感度核(Fisher Sensitivity Kernel,核模型对变化的敏感程度)
  • 无限宽度的 AI 等同于 高斯过程(Gaussian Process,一种标准的统计工具)

然而,作者认为 AI 对“开放”的一面是盲目的。AI 将它丢弃的任何信息(比如忽略句子中的一个词或切断网络的一部分)都视为简单的错误或近似误差。它并没有将其视为需要被追踪和守恒的物理损失

“通量账本”

在核物理中,当粒子逃逸时,理论并不仅仅说:“噢,我们丢了一些。”它会说:“我们向通道 A 损失了恰好 0.5 个单位的概率,向通道 B 损失了 0.2 个单位,这是证明这一点的数学依据。”

作者尝试为 AI 构建这样一个“通量账本”。他问道:如果我们把 AI “被忽略”的部分视为一扇漏风的门,我们能否追踪丢失的概率?

令人惊讶的结果(“负面”发现)

作者运行了测试,以观察这种“开放式”数学是否适用于真实的 AI 模型(例如大语言模型中的注意力机制,或选择使用哪些专家的路由机制)。

结果: 大多失败了

  • 原因: 对于“开放式”数学要奏效,你所忽略的部分需要像一片无限的海洋,波浪可以在其中永远传播(一个连续谱)。
  • 问题所在: AI 模型通常是有限的且具有“耗散性(dissipative)”的(它们会趋于平缓和稳定)。它们并不具备那种“无限海洋”的特性。
  • 后果: 当作者试图将“开放式”数学强加于 AI 时,这个“通量账本”要么不存在,或者所谓的“损失”仅仅是他切割数据时产生的伪影,而非真实的物理属性。

“幻觉”的转折

作者还研究了一个流行的想法:这种“泄露”数学能否检测出 AI 何时在产生“幻觉”(编造事实)?

答案是: 不能。

  • 原因: 当 AI 自信地产生幻觉时,它实际上是非常“封闭”的。它强烈地致力于一个错误的答案。由于模型非常确定,所以“泄露”(不确定性)很低。
  • 真正的确定性: 真正重要的不确定性(认识论不确定性——即模型是否知道答案)存在于数学的“封闭”部分(集成模型的方差),而不是“开放”部分。

总结

  • 地图: 论文绘制了一张地图,展示了 AI 和核物理在“忽略”事物方面共享相同的代数逻辑。
  • 差距: AI 只使用了“封闭”(无损)的版本。而核物理拥有一套完整发展的关于“开放”(有泄露)版本的理论,包括对流失部分的严格统计。
  • 测试: 作者试图将“开放式”理论引入 AI。
  • 结论: 效果不佳。真实的 AI 模型过于有限且具有“弛豫性(relaxational)”,无法支持核物理中所使用的那种复杂的、波动式的“开放式”数学。作者希望发现的那些“开放式”特征,要么不存在,要么只是数学上的伪影。

简而言之: 这篇论文是一个警示。它告诉我们,虽然我们可以借鉴核物理的一些数学工具,但他们用来追踪逃逸粒子的那些特定的“泄露式”工具,并不自然地适用于当前的 AI 架构。AI 中“有用”的不确定性仍然存在于“封闭”的统计侧,而非“开放”的动力学侧。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →