Reinforcement Learning Assisted Quantum Simulation of Many-Body Excited States and Real-Time Dynamics

本文通过将深度 Q 网络用于自适应选择紧凑的双体算符,将强化学习收缩量子本征求解器(RL-CQE)扩展至高效计算多费米子电子激发态和实时动力学,在具有可扩展态表示和恒定缩放时间演化的情况下实现了化学精度。

原作者: Jiaji Zhang, Lipeng Chen, Carlos L. Benavides-Riveros

发布于 2026-05-19
📖 1 分钟阅读🧠 深度阅读

原作者: Jiaji Zhang, Lipeng Chen, Carlos L. Benavides-Riveros

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正在尝试解决一个巨大而复杂的拼图。在量子化学的世界里,这个拼图就是弄清楚电子在分子中如何行为,尤其是当它们被激发时(例如植物吸收阳光时)或随时间快速运动时。

传统上,在量子计算机上解决这个拼图,就像试图通过同时向各个方向迈出微小且固定的步伐来攀登一座高山。这种方法虽然可行,但速度缓慢,需要巨大的能量,而且一旦踏错一步,就可能陷入困境。

本文介绍了一种更聪明的攀登该高山的方法,使用一种称为**强化学习(RL)**的“向导”。以下是作者新方法的运作原理,分解为简单的概念:

1. 问题:“同时全部”攀登

旧方法(称为 CQE)试图同时调整整个拼图解决方案。想象一下,试图通过同时拉扯一团乱麻中的每一根线来解开它。这很混乱,而且你往往会得到一个难以解开的结。在量子术语中,这意味着计算机需要运行非常长且复杂的操作序列(深度的“电路”)才能获得正确答案。

2. 解决方案:“智能向导”(RL-CQE)

作者用强化学习智能体取代了“一次性拉扯所有东西”的策略。将这个智能体想象成一位拥有地图的熟练徒步者。

  • 运作方式:徒步者不是拉扯所有线,而是观察拼图的当前状态,并问道:“现在哪一个动作能让我最接近解决方案?”
  • 结果:徒步者选择最佳动作,执行它,然后重新评估。这创造了一条通往解决方案的更短、更直接的路径。论文表明,这种“一次一步”的方法比旧方法使用的步骤(算子)少得多,同时仍能达到相同的高精度(化学精度)。

3. 攻克“激发”态

通常,量子计算机擅长寻找“基态”(分子最放松、最平静的状态)。但自然界往往是动态的;分子会被激发,跃迁到更高的能级,并做出各种疯狂的事情。

  • 挑战:寻找这些激发态就像试图同时找到几座不同山峰的顶峰。
  • 创新:作者调整了他们的“智能向导”,使其能够同时处理多座山峰。他们证明,该向导能够像导航平静的基态一样,同样出色地导航这些复杂的激发态景观。他们还表明,该向导不需要事先知道每座山峰的确切重量;它可以自行找出正确的平衡点,使其更加稳健,不易失败。

4. 时间旅行问题:模拟运动

模拟分子随时间的变化(实时动力学)通常是量子计算机的噩梦。

  • 旧方法:要模拟 10 秒的时间,你可能需要将其分解为 1,000 个微小步骤。要模拟 100 秒,则需要 10,000 个步骤。“电路”(指令列表)变得越来越长,直到计算机崩溃。
  • 新方法:作者发现了一个技巧。由于他们是一起观察一组状态(“纯化系综”),他们可以在整个模拟过程中重复使用同一组“动作”。
  • 类比:想象你在录制视频。旧方法就像单独拍摄每一帧并存储所有帧,需要巨大的存储空间。新方法则像是意识到相机运动遵循特定的模式。你只需要存储模式(固定的动作集)和起点。无论视频有多长,“存储”(电路大小)都保持不变。这使得他们能够模拟时间演化,而不会让计算机不堪重负。

5. 证明:在简单分子上进行测试

作者在两个简单分子上测试了这个新的“智能向导”:氢气(H2H_2)和三氢链(H3+H_3^+)。

  • 结果:该向导以惊人的精度找到了这些分子在不同形状和距离下的正确能级。
  • 效率:它仅用极少的步骤就完成了这一任务(有时仅需 2 或 5 个动作),而旧方法则需要多得多。
  • 时间:在模拟这些分子随时间运动时,“电路”大小保持恒定,证明该方法具有良好的可扩展性,并且不会随着时间的推移而变得沉重。

总结

简而言之,本文提出了一种利用量子计算机研究分子在被激发或运动时行为的新方法。通过使用一个 AI“向导”,该向导在每一步选择最佳单个动作,他们创造了一种具有以下特点的方法:

  1. 更快:解决拼图所需的步骤更少。
  2. 更智能:无需完美的先验知识即可处理复杂的激发态。
  3. 可扩展:能够模拟时间的流逝,而不会让计算机被不断增长的指令列表所拖累。

这使我们更接近利用当今有限的量子计算机来解决以前无法模拟的化学和物理领域的现实世界问题。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →