Integrating Out, Twice:The Open-System Case That Neural-Network Ensemble… — 通俗解释

想象你正在试图理解一个复杂的系统，比如一个拥挤的房间或一个神经网络（一种人工智能类型）。有时，你无法追踪每一个人或每一个数字。你必须决定去忽略系统的一部分，以便专注于你关心的部分。

在物理学和数学中，这种“忽略”或“积分掉”（integrating out）系统一部分的行为是一种标准做法。作者 Jin Lei 认为，这种做法有两种截然不同的方式：虽然 AI 研究者主要使用其中一种，但核物理学家已经精通了另一种。

类比： 想象你正在给一群朋友拍照，但你决定把背景模糊处理。

发生了什么： 你失去了背景的细节，但你朋友的照片依然保持清晰且“完整”。模糊处理并没有偷走你朋友的光线或能量；它只是移除了背景数据。
在 AI 中： 当 AI 研究者对神经网络中的随机数字（参数）进行平均化处理时，他们得到的是一个“封闭”的结果。数学保持简单、真实且对称。这是一种无损的总结。没有任何东西“逃逸”。

类比： 想象你在一个门虚掩着的房间里。你正在尝试追踪房间内的空气压力。

发生了什么： 空气通过门缝漏了出去。如果你试图仅通过描述房间“内部”的空气来建模，你的描述必须考虑到空气正在流失的事实。数学会变得“有泄露性”且复杂。你必须建立一份严格的账本（收据），记录究竟有多少空气逃逸以及去了哪里。
在核物理中： 这被称为光学模型（Optical Model）。当原子核与粒子发生相互作用时，一些粒子会逃逸到“连续谱”（the continuum，即宇宙的其余部分）。描述原子核的数学变得是“非厄米（non-Hermitian）”的（这是一个高级说法，意指它是复杂且有泄露性的）。至关重要的是，数学中包含了一个通量账本（Flux Ledger）：一份关于离开系统的概率之精确统计。

作者说：“AI 只在做‘封闭版’。它缺失了‘开放版’。”

AI 研究者拥有一套优秀的词典，用于在他们的“封闭”数学与核物理之间进行翻译。例如：

神经切线核（Neural Tangent Kernel，AI 如何学习） 等同于 费舍尔敏感度核（Fisher Sensitivity Kernel，核模型对变化的敏感程度）。
无限宽度的 AI 等同于 高斯过程（Gaussian Process，一种标准的统计工具）。

然而，作者认为 AI 对“开放”的一面是盲目的。AI 将它丢弃的任何信息（比如忽略句子中的一个词或切断网络的一部分）都视为简单的错误或近似误差。它并没有将其视为需要被追踪和守恒的物理损失。

在核物理中，当粒子逃逸时，理论并不仅仅说：“噢，我们丢了一些。”它会说：“我们向通道 A 损失了恰好 0.5 个单位的概率，向通道 B 损失了 0.2 个单位，这是证明这一点的数学依据。”

作者尝试为 AI 构建这样一个“通量账本”。他问道：如果我们把 AI “被忽略”的部分视为一扇漏风的门，我们能否追踪丢失的概率？

作者运行了测试，以观察这种“开放式”数学是否适用于真实的 AI 模型（例如大语言模型中的注意力机制，或选择使用哪些专家的路由机制）。

结果： 大多失败了。

作者还研究了一个流行的想法：这种“泄露”数学能否检测出 AI 何时在产生“幻觉”（编造事实）？

答案是： 不能。

地图： 论文绘制了一张地图，展示了 AI 和核物理在“忽略”事物方面共享相同的代数逻辑。
差距： AI 只使用了“封闭”（无损）的版本。而核物理拥有一套完整发展的关于“开放”（有泄露）版本的理论，包括对流失部分的严格统计。
测试： 作者试图将“开放式”理论引入 AI。
结论： 效果不佳。真实的 AI 模型过于有限且具有“弛豫性（relaxational）”，无法支持核物理中所使用的那种复杂的、波动式的“开放式”数学。作者希望发现的那些“开放式”特征，要么不存在，要么只是数学上的伪影。

简而言之： 这篇论文是一个警示。它告诉我们，虽然我们可以借鉴核物理的一些数学工具，但他们用来追踪逃逸粒子的那些特定的“泄露式”工具，并不自然地适用于当前的 AI 架构。AI 中“有用”的不确定性仍然存在于“封闭”的统计侧，而非“开放”的动力学侧。

Integrating Out, Twice:The Open-System Case That Neural-Network Ensemble Theory Is Missing