Scalably learning quantum many-body Hamiltonians from dynamical data

原作者： Frederik Wilde, Augustine Kshetrimayum, Ingo Roth, Dominik Hangleiter, Ryan Sweke, Jens Eisert

发布于 2026-06-10

📖 1 分钟阅读🧠 深度阅读

原作者： Frederik Wilde, Augustine Kshetrimayum, Ingo Roth, Dominik Hangleiter, Ryan Sweke, Jens Eisert

原始论文采用 CC BY 4.0 许可（http://creativecommons.org/licenses/by/4.0/）。 ✨ 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性，请参阅原始论文。阅读完整免责声明

想象一下，你有一个装在密封盒子里、神秘且复杂的机器。你看不见里面的齿轮或电线（即“哈密顿量”，它是规定机器如何运作的数学规则），但你可以通过戳它、摇晃它并观察其反应来了解它。你的目标是仅仅通过观察机器的运动，就推导出那本精确的规则书。

这篇论文介绍了一种全新的、高效的方法，来解决针对量子机器（由原子或电子等微小粒子组成的系统）的这个谜题。以下是他们是如何实现的，通过简单的解释说明：

问题所在：黑盒

在量子世界中，科学家们经常构建设备（如量子计算机或模拟器），但并不百分之百确定支配它们的精确规则。他们有一个假设，但需要去证明它。通常，为了弄清规则，你需要让机器处于许多种不同的初始状态，并以许多种不同的方式进行测量。这就像是通过用不同的原料和烤箱烤一千次蛋糕，来试图猜出蛋糕的配方。这既缓慢、昂贵又困难。

解决方案：“聪明侦探”法

作者创建了一种方法，其作用就像一个超级聪明的侦探。他们不需要进行一百万次实验，该侦探只需要：

一个初始位置： 他们让机器处于一个简单的、平静的状态（比如所有粒子都指向“上”）。
几次快速快照： 他们让机器运行一小段时间，然后对粒子的状态进行一次快速的“拍照”（测量）。他们重复这个过程几次。
一个计算机大脑： 他们使用一个强大的计算机算法来猜测规则书，模拟如果该规则书成立将会发生什么，并将结果与他们拍摄的真实照片进行对比。

两大秘密武器

为了使这种方法适用于庞大的系统（高达 100 个粒子，这对于量子计算机来说很多），他们结合了两个强大的工具：

张量网络（“压缩技巧”）：
想象一下，你试图描述一个巨大的、缠绕在一起的毛线球。记录下每一根线头将耗费很长时间。相反，你应该描述缠绕的“模式”。“张量网络”是一种描述复杂量子系统而不被海量数据所困扰的数学方法。它就像是一个压缩文件，可以将一部巨大的电影压缩，以便装进你的手机。这使得他们能够模拟那些对于普通计算机来说过于庞大的系统。
机器学习（“自我修正循环”）：
他们使用了一种名为“基于梯度的优化”的技术。可以把它想象成调收音机。你稍微转动旋钮，听听静电噪音，如果噪音变大了，你就往相反的方向转。计算机猜测一组规则，检查错误程度，然后自动调整规则以接近真相。它会重复此过程数千次，直到“静电噪音”（误差）消失为止。

结果：他们的发现

团队在模拟量子系统（一串自旋链，类似于一排微型磁铁）上测试了该方法。以下是他们的发现：

它具有可扩展性： 他们成功学习了超过 100 个粒子的系统规则。这意义重大，因为大多数方法在系统变得如此之大时都会失效。
它具有数据效率： 他们猜测的准确度随着收集的数据点增加而提高，遵循一种可预测的模式（即数据越多，猜测越准，具体表现为随数据规模的平方根进行改进）。
它具有灵活性： 出人意料的是，他们发现不需要准备许多种不同的初始状态，也不需要以许多复杂的方式进行测量。即使从一个简单的状态开始，并仅用一两种测量方式，也足以得到正确答案。
“时间的甜点位”： 他们发现了一个“金发姑娘区”（适中区间）的时间控制。如果观察时间太短，信号太弱，听不清；如果观察时间太长，系统会变得过于混乱而难以模拟。但在中间范围内，该方法表现完美。

为什么这很重要

这种方法就像是给了科学家一台高倍率的显微镜。它允许科学家构建好一个量子设备后，通过进行几次简单的测试，就能通过数学手段“逆向工程”出其内部精确的物理机制。这对于建立对量子计算机的信任，并确保它们完全按照工程师的设计进行工作至关重要。

简而言之，他们创造了一种方法，利用极少的数据和标准的计算机算力，就能学习一个复杂量子机器的“DNA”，这使得理解以前过于庞大而无法理解的系统成为可能。

技术摘要：从动力学数据中可扩展地学习量子多体哈密顿量

问题陈述
封闭量子力学系统的物理学由其哈密顿量（Hamiltonian）决定。虽然理论物理学通常从指定一个哈密顿量开始，但在实际场景中——特别是在模拟量子模拟器和近期的量子处理器中——有效的哈密顿量很少能被高精度地获知。现有的哈密顿量学习方法面临显著的局限性：理论方法通常依赖于热态、本征态或极短时间的演化，这些可能无法捕捉复杂的相互作用；而利用长时间动力学的实用方法则往往难以应对预测大规模系统时间演化的计算挑战。此外，许多现有的可扩展方法需要特定的状态制备、期望值的估计，或者表现出难以承受的扩展规模。因此，需要一种能够从动力学数据中学习相互作用的多体哈密顿量的方法，使其能够扩展到大型系统（例如 >100 个自旋），且对实验友好，并对有限的测量资源具有鲁棒性。

方法论
作者提出了一种数据驱动的方法，该方法将基于梯度的机器学习与通过张量网络实现的高效量子态表示相结合。其核心工作流包括：

数据采集： 一个由 $n$ 个自旋组成的封闭量子系统被初始化为一个简单的积态（具体为 $|0\rangle^{\otimes n}$ ）。系统在未知的哈密顿量 $H^*$ 下进行时间演化。在各个时间点 $t_j$ ，系统在随机选择的泡利基（Pauli bases） $p_k$ 下进行测量。生成的数据集 $D$ 由二进制测量结果（位串）组成，无需进行期望值处理。
通过张量网络进行模拟： 为了在经典端模拟该系统，作者采用了时间演化块解积算法（TEBD）。该算法利用矩阵乘积态（MPS）来表示量子态，从而实现对一维系统在中间时间段内的有效计算。时间演化算符被分解为 Trotter 步，并通过截断键维数（bond dimensions）来管理纠缠增长，从而引入可控的截断误差。
优化框架： 学习任务被表述为一个极大似然估计（MLE）问题。定义了一个基于物理直觉的参数化哈密顿量类 $C = \{H(\theta)\}$ （例如相互作用强度和局部场）。目标是寻找参数 $\theta$ ，使得负对数似然损失函数 $L_D(\theta)$ 最小化，该函数衡量了观测到的测量结果与模型 $H(\theta)$ 预测的概率之间的差异。
基于梯度的学习： 为了处理高维参数空间，作者利用自动微分（通过 JAX 框架）来计算损失函数相对于 $\theta$ $θ$ 的梯度。这涉及通过整个 TEBD 算法（包括处理复数输入的奇异值分解 SVD）进行反向传播导数。优化过程分为两个阶段：
- 第一阶段： 使用 ADAM 优化器和微批次（mini-batches）进行随机梯度下降，以快速接近局部极小值。
- 第二阶段： 使用全数据集配合 BFGS（伪牛顿）优化器，将解精炼至高精度。

主要贡献

可扩展性： 该方法被证明在一维系统中随系统规模线性扩展，能够学习包含超过 100 个自旋的系统哈密顿量。
数据效率与简洁性： 该算法直接作用于原始测量位串，避免了估计期望值或准备多种不同初始态的需求。即使仅使用单个初始态和少量泡利基，它也能有效运行。
机器学习与张量网络的集成： 本研究成功地将机器学习技术（自动微分、随机优化）与张量网络模拟（TEBD）结合起来，以解决量子多体物理中的非凸优化问题。
理论扩展性： 作者确立了在哈密顿量类是良置（well-conditioned）的假设下，参数恢复的相对误差随数据集大小 $d$ 按 $d^{-1/2}$ 比例缩放。

结果
数值实验是在由带有随机局部场的一维海森堡模型生成的合成数据上进行的。

系统规模： 该方法成功恢复了高达 100 个自旋系统的哈密顿量参数。研究发现，相对误差在很大程度上与系统规模 $n$ 和参数数量 $\nu$ 无关。
数据规模： 误差根据预测的 $d^{-1/2}$ 比例随测量样本数量的增加而降低。
测量约束： 即使受限于单一泡利基，该算法仍然有效，尽管这会增加优化失败（离群值）的速率。
时间戳： 增加时间戳的数量可以提高全局极小值的准确性，但也会增加损失函数的崎岖程度，导致更多的离群值。因此，需要多少次随机初始化才能找到全局极小值，成为了一个取决于观测到离群值数量的超参数。

意义与主张
本文将该方法定位在时间演化持续时间的“甜点区”：它既避免了极短时间展开带来的低信噪比问题，也避开了长时间动力学带来的计算不可行性。作者声称该方法非常实用且对实验友好，因为它仅需要原生的时间演化和标准的泡利测量，不需要复杂的态操纵（如泡利旋转/twirls）或特定的状态制备。

其重要性在于为量子设备的精确工程提供了一种原语（primitive），特别是对于状态制备和测量灵活性较高但底层哈密顿量未知的模拟量子设备（如捕获离子、超冷原子）。作者谦虚地指出，虽然该方法允许精确的哈密顿量标定，但对于这类已标定的系统，预测其长时间动力学在计算上仍然是困难的；因此，该方法最适合用于标定，而非在没有进一步实验验证的情况下进行长期预测。作者建议的未来扩展方向包括处理随时间变化的哈密顿量、耗散系统（林德布拉德/Lindbladians），以及纳入对状态制备与测量（SPAM）误差的鲁棒性。