How to use quantum computers for biomolecular free energies

原作者： Jakob Günther, Thomas Weymuth, Moritz Bensberg, Freek Witteveen, Matthew S. Teynor, F. Emil Thomasen, Valentina Sora, William Bro-Jørgensen, Raphael T. Husistein, Mihael Erakovic, Marek Miller, Leah W

发布于 2026-04-24

📖 1 分钟阅读🧠 深度阅读

查看于 arXiv ↗PDF ↗

✨

这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性，请参阅原始论文。阅读完整免责声明

该语言暂无解释。

试试： DE, EN, ES, FR, IT, JA, KO, NL, PT, ZH

Each language version is independently generated for its own context, not a direct translation.

这是一份关于论文《How to use quantum computers for biomolecular free energies》（如何利用量子计算机计算生物分子自由能）的详细技术总结。

1. 研究背景与核心问题 (Problem)

生物分子自由能计算的重要性：自由能计算是预测生物分子（如药物与蛋白质）结合亲和力的核心，对于理解细胞信号传导、疾病机制及药物研发至关重要。
现有方法的局限性：
- 精度与规模的矛盾：准确的自由能计算需要同时捕捉复杂的电子相互作用（量子力学效应）和巨大的构象空间采样（熵效应）。传统的经典计算机无法在合理时间内对大生物分子进行高精度的量子力学（QM）计算，因为波函数描述的内存需求随电子数呈指数级增长（“维数灾难”）。
- 力场的不足：传统的分子力学（MM）力场在处理过渡金属（如抗癌药中的钌）或强电子关联体系时精度不足。
- 量子计算的潜力与障碍：虽然量子计算机理论上能线性扩展处理量子系统，但目前的计算流程缺乏将高精度量子数据与大规模生物分子采样有效结合的框架。此外，现有的量子算法资源需求巨大，且缺乏针对生物自由能计算的具体实施路径。

2. 方法论：FreeQuantum 流程 (Methodology)

作者提出并实现了一个名为 FreeQuantum 的端到端计算流程，旨在通过机器学习（ML）和多层量子嵌入策略，将昂贵的量子计算数据高效地整合到生物分子自由能计算中。

核心架构：三层量子嵌入 (QM/QM/MM)

该流程采用“量子 - 量子 - 经典”（QM/QM/MM）的嵌套嵌入策略：

外层（MM）：使用经典力场进行分子动力学（MD）模拟，对生物大分子（蛋白质 + 配体）进行构象采样。
中层（QM/MM）：定义一个较大的“量子区域”（通常包含配体及关键残基），使用密度泛函理论（DFT）处理，结合经典环境。
内层（量子核心，Quantum Core）：在量子区域内进一步定义更小的“量子核心”（如过渡金属活性位点），使用最高精度的波函数方法（如 CAS-SCF, NEVPT2, CCSD(T)）或未来的量子算法处理。

关键组件与流程

自由能微扰 (FEP)：利用非平衡态切换（NEQ）和 MBAR 方法，通过“炼金术”路径（Alchemical Path）计算结合自由能差（ $\Delta G_{binding}$ ）。
机器学习势函数 (ML Potentials)：
- ML1：基于 QM/MM 数据训练，用于初步修正力场。
- ML2：基于 QM/QM/MM 的高精度数据，通过迁移学习 (Transfer Learning) 对 ML1 进行微调。由于高精度计算昂贵，数据稀疏，迁移学习允许用少量高精度数据修正大量低精度数据。
主动学习 (Active Learning)：在采样过程中识别高不确定性结构，自动触发新的量子计算以补充训练数据，确保势能面的准确性。
量子引擎接口：流程设计为模块化，目前的量子核心计算使用传统超算（HPC）运行高精度波函数方法，但架构预留了接口，未来可直接替换为量子计算机（运行量子相位估计 QPE 等算法）。

3. 关键贡献 (Key Contributions)

首个端到端生物自由能量子计算流程：提出了 FreeQuantum，首次展示了如何将高精度的量子化学数据（包括未来量子计算机的数据）无缝集成到生物大分子的自由能计算中。
双重嵌入策略：
- 利用Huzinaga 投影嵌入和Bootstrap 嵌入两种策略，灵活处理不同大小的量子核心。
- 解决了过渡金属（开壳层、强关联）体系的计算难题，这是传统力场难以处理的。
迁移学习的应用：证明了利用稀疏的高精度量子数据（QM/QM/MM）通过迁移学习修正 ML 势函数（ML2）的可行性，从而在保持计算效率的同时大幅提升精度。
量子优势的资源估算：针对具体的钌基抗癌药物体系，详细估算了未来量子计算机实现“量子优势”所需的资源（量子比特数、门操作数、错误率、运行时间），为硬件发展提供了明确目标。
开源与自动化：该流程高度自动化，减少了人工干预，且代码将开源，促进了生物化学与量子计算的交叉研究。

4. 研究结果 (Results)

案例研究：以钌基抗癌药物 NKP-1339 与其靶点蛋白 GRP78 的结合为例。
- 该体系属于“高构象自由度 + 强电子关联”（生物分子量子模拟四边形左上角），是极具挑战性的案例。
精度提升：
- 纯 MM 力场： $\Delta G \approx -19.1$ kJ/mol。
- QM/MM (DFT)： $\Delta G \approx -17.0$ kJ/mol。
- QM/QM/MM (高精度波函数，如 NEVPT2/CCSD(T))： $\Delta G \approx -10.8$ 至 $-11.3$ kJ/mol。
- 结果显示，引入高精度量子核心后，结合自由能预测值发生了显著变化（约 6-8 kJ/mol 的偏差），证明了高精度电子结构计算对生物自由能预测的关键影响。
量子资源估算：
- 对于包含 30-60 个空间轨道的活性空间，若要实现化学精度（~1 kJ/mol）并在 20 分钟内完成单次能量计算，需要约 1000 个逻辑量子比特，门错误率低于 $10^{-10}$ ，且平均门时间需低于 $10^{-7}$ 秒。
- 通过并行化（利用多台量子计算机），整个流程有望在 24 小时内完成，达到实验对比的时间尺度。

5. 意义与展望 (Significance)

重新定义生物量子模拟：该研究打破了“自由能计算因采样量太大而无法使用量子计算机”的固有观念。通过多层嵌入和机器学习，将量子计算的作用范围缩小到关键的“量子核心”，使得在现有及近期未来的量子硬件上实现生物分子自由能计算成为可能。
药物研发的范式转变：提供了一种能够处理过渡金属药物、酶催化等复杂生物过程的通用框架，有望显著提高药物筛选和蛋白质设计的准确性。
指导硬件发展：通过具体的资源估算，为量子硬件开发者提供了清晰的路线图（如所需的比特数、相干时间和错误率），明确了实现生物领域量子优势的具体门槛。
通用性：该流程不仅适用于分子识别，还可推广至任何需要高精度原子级模拟的生物化学问题。

总结：这篇论文不仅展示了如何利用当前的经典超算结合机器学习来模拟复杂的生物量子系统，更重要的是，它构建了一个通往未来量子计算的桥梁，证明了通过合理的算法设计（嵌入 + 迁移学习），量子计算机有望在生物自由能计算这一关键领域率先实现实用化的量子优势。