Solving Classical and Quantum Spin Glasses with Deep Boltzmann Quantum States

想象一下，你正试图在一片广阔、迷雾重重且极其崎岖的山脉中找到绝对的最低点。这并非普通山脉；它是一个“自旋玻璃”景观。在物理学中，这些系统里的粒子（自旋）处于“挫败”状态——它们希望处于某个位置，但邻居却希望它们去别处，从而制造出充满陷阱的混乱局面。

如果你试图用标准地图（传统计算机方法）走下这座山，你很可能会被困在一个小山谷里，误以为已到达底部，而实际上在下一个山脊的另一侧还有一个更深得多的山谷。这篇论文将这些称为“局部极小值”，它们正是计算机难以解决这些问题的原因。

以下是该论文作者提出的解决方案，结合了深度学习和量子物理概念。

1. 新地图：深度玻尔兹曼量子态（DBQS）

想象一台试图解决此谜题的标准计算机，就像一个一次只能迈出一小步的徒步者。如果撞到了墙，他们必须转身尝试另一小步。在复杂的地形中，这既缓慢又低效。

作者引入了一种新工具，称为深度玻尔兹曼量子态（DBQS）。

类比：想象你不是徒步者，而拥有一队“幽灵”（隐藏变量），它们能一次性看到整座山脉。这些幽灵不接触地面（不直接贡献能量），但它们与真正的徒步者（物理自旋）手牵手，为其指引方向。
优势：因为这些幽灵能“看见”全局，系统可以进行全局更新。与其迈出一小步，如果某处看起来有希望，整个团队可以一起跳跃到山脉的完全不同部分。这避免了陷入其他方法会受困的那些虚假小山谷。

2. 训练策略：神经量子退火（NQA）

即使有了一张好地图，你也需要好的策略才能到达底部。作者使用了一种称为**神经量子退火（NQA）**的方法。

类比：想象你试图在一个摆满家具的黑暗房间里找到最低点。如果你只是随机开始行走，你会撞到东西。
- “简单”的开始：首先，房间是空旷且平坦的。你可以轻松找到中心。
- “困难”的终点：然后，慢慢地，家具（复杂问题）开始出现。
- 策略：算法从空房间开始。随着家具慢慢出现，它会轻轻推动你的位置，使你在面对新障碍时仍能保持在最佳位置。它不试图一次性解决最终那个混乱的房间。它通过从简单开始并逐渐增加难度来“预热”解决方案。
转折：作者意识到，你不需要在这个过程的每一步都保持完美精确。你只需要始终“足够接近”正确路径，这样当房间里堆满家具时，你已经处于正确的角落。这节省了巨大的计算能力。

3. 结果：解决不可解之谜

团队在两类挑战上测试了这种新的“幽灵徒步者”系统：

物理测试（沙林顿 - 柯克帕特里克模型）：他们试图寻找具有100 和 200 个自旋的系统的最低能量状态。
- 结果：标准方法（如“迈小步的徒步者”）失败或陷入停滞。他们的新方法在几乎所有测试案例中都找到了确切的最低点（或接近到无法区分的点）。他们甚至解决了 200 个自旋的版本，而在该规模下，传统的精确计算机求解器通常会放弃。
现实世界测试（作业车间调度）：他们将此应用于经典的物流问题：安排机器上的作业以尽可能快地完成。这是一个“组合优化”问题，在数学上与自旋玻璃问题非常相似。
- 结果：他们解决了当前量子计算机（如 D-Wave 机器）甚至无法将其硬件适配的实例。他们成功找到了涉及数百个变量的问题的最优调度方案。
量子测试（横向场 SK）：他们还尝试解决一个量子效应（如粒子同时处于两个位置）处于活跃状态的问题版本。
- 结果：他们的方法成功识别了 100 个自旋量子系统的基态，证明它不仅适用于“经典”谜题，也适用于真正的量子奥秘。

总结

简单来说，作者构建了一个基于深度学习的智能指南，利用“幽灵”助手一次性看清整个问题。他们不试图一次性解决一个巨大而混乱的谜题，而是从一个简单的版本开始，慢慢增加难度，并在过程中引导解决方案。

这种方法使他们能够解决目前对标准计算机来说过于复杂、对现有量子硬件来说规模过大的复杂优化问题和量子物理谜题。他们不仅找到了更好的下山方式，更找到了一种直接“瞬移”到底部的方法。

技术摘要：利用深度玻尔兹曼量子态求解经典与量子自旋玻璃问题

问题陈述
由于存在淬火无序和能量阻挫，求解经典和量子自旋玻璃的基态问题仍然是一项艰巨的挑战。这些因素创造了一个崎岖的能量景观，其特征是存在大量由高能垒分隔的局部极小值。这种拓扑结构阻碍了基于传统 Metropolis 的蒙特卡洛（MCMC）方法的效率，这些方法依赖于局部更新规则，难以逃离局部陷阱，导致混合时间呈指数级缓慢。虽然神经量子态（NQS）在求解强关联系统的基态问题方面已显示出成功，但标准的 NQS 实现通常依赖于局部 Metropolis 更新，继承了 MCMC 在玻璃态系统中的采样低效性。此外，物理量子退火（QA）硬件面临噪声、有限温度效应、有限的量子比特连接性以及嵌入开销等方面的限制，往往无法解决大规模或复杂的组合优化问题。

方法论
作者提出了一个框架，将一种新颖的变分假设——深度玻尔兹曼量子态（DBQS）——与一种称为**神经量子退火（NQA）**的高级训练算法相结合。

深度玻尔兹曼量子态（DBQS）：
- 作者引入了玻尔兹曼量子态（BQS），这是一种受深度玻尔兹曼机（DBMs）启发的变分假设。在此表述中，通过引入隐藏量子自旋（被解释为未观测的量子自由度）来扩展物理系统。
- 在这个扩大的系统上定义了一个类似 Jastrow 的变分波函数。隐藏自旋不直接贡献能量，但编码了物理自旋之间的量子关联。
- 关键在于，DBQS 架构继承了经典 DBMs 的高效块吉布斯采样能力。与需要局部 Metropolis 更新的标准 NQS 不同，DBQS 允许全局更新，即同一层中的所有自旋同时更新。这导致自相关时间随着系统尺寸的增加保持为 $O(1)$ ，与局部更新规则相比，速度提升了至少一个数量级。
- 该表述简化了计算任务：解析变分导数是自旋变量的简单乘积（避免了反向传播），局部算符（如局部能量）简化为简单的矩阵乘法。
神经量子退火（NQA）：
- 为了解决直接在目标哈密顿量上优化的困难，作者调整了变分量子退火（VQA）框架。
- 弛豫绝热性： 该算法通过参数 $s$ 将问题哈密顿量从易解区域（非相互作用驱动项）插值到难解区域（目标自旋玻璃）。与严格的绝热演化不同，NQA 不要求变分流形在中间时刻紧密近似瞬时绝热态。相反，它利用上一步的解作为下一步的“热启动”，以补偿后续步骤中的数值误差。
- 优化增强： 标准的随机重构（SR）算法增加了动量和先进的随机优化器。这种组合加速了收敛并稳定了训练。
- 催化剂： 该框架允许包含催化剂哈密顿量（ $H_C$ ），具体为非 stoquastic 项（ $\sum \sigma_y$ ），它可以重塑能量景观以缓解一阶相变并改善采样，这是当前量子退火器所不具备的功能。
- 持久链： 该算法在整个退火调度过程中维护一组持久的马尔可夫链，从它们最后的态恢复运行，而不是重新热化，从而进一步提高了效率。

主要贡献

新颖假设： 引入了 DBQS，它将深度神经网络的表达能力与块吉布斯链的采样效率相结合，专门针对玻璃态系统进行了定制。
算法框架： 开发了 NQA，将自然梯度与动量、弛豫绝热性条件以及持久吉布斯采样相结合，以穿越崎岖的能量景观。
计算效率： 证明了所提出的方法避免了反向传播和局部 Metropolis 采样的计算瓶颈，使得研究具有数百个自旋的系统成为可能。
超参数优化： 使用 Optuna 进行自动化超参数优化（HPO）来调整相关参数，避免了任意固定值的使用。

结果
作者在几个具有挑战性的问题上对其方法进行了基准测试：

经典 Sherrington-Kirkpatrick (SK) 模型： 对于具有无限范围相互作用的 $N=100$ 和 $N=200$ 个自旋，DBQS 结合 NQA 实现了精确或近精确的基态能量。具体而言，对于 $N=200$ ，该方法在 10 个实例中找到了 8 个精确基态，优于标准 SR 优化和之前的 NQS 方法（cRBM, RBQS），后者在计算预算内未能解决这些实例。
作业车间调度问题（JSSP）： 该方法被应用于 NP 难 JSSP 的决策版本，该版本被重新表述为 Ising 自旋玻璃。作者求解了经过变量剪枝后具有数百个自旋的实例，这些实例超出了 D-Wave Advantage 2 量子退火器的嵌入能力。他们在 10 个测试实例中找到了 8 个精确解。
横场 SK 模型： 对于 $N=100$ 个自旋的量子自旋玻璃，该方法成功地在自旋玻璃相内识别出了基态。结果表明，最佳试验收敛到的能量低于经典基态能量，表明成功捕捉到了量子效应。对于 $N=16$ ，该方法与精确对角化结果相匹配。

意义与主张
本文声称，配备高效全局更新规则（DBQS）并在受退火启发的方案（NQA）中训练的深度神经网络架构，为解决经典和量子自旋玻璃问题提供了一个强大且灵活的框架。作者断言，这种方法使得研究无序量子多体系统以及解决超出当前精确经典求解器和量子退火硬件限制的现实世界硬组合优化任务成为可能。这项工作将该方法论定位为研究大规模量子自旋玻璃和解决传统启发式方法和物理量子设备难以处理的 NP 难问题的可行替代方案。作者指出，虽然该方法属于启发式方法且缺乏关于求解时间的严格理论保证，但其在多样化基准测试中一致的实证性能表明，它是实际应用中一个有希望的候选者。

1. 新地图：深度玻尔兹曼量子态（DBQS）

2. 训练策略：神经量子退火（NQA）

3. 结果：解决不可解之谜

总结

技术摘要：利用深度玻尔兹曼量子态求解经典与量子自旋玻璃问题

类似论文