Universal Quantum Computer Simulation of 50 Qubits on Europe`s First Exascale Supercomputer Harnessing Its Heterogeneous CPU-GPU Architecture

研究人员首次利用欧洲 JUPITER 百亿亿次级超级计算机的异构 GH200 架构,通过三项关键创新——即借助 CPU-GPU 互连扩展内存利用、自适应数据编码以及实时网络流量优化器——成功模拟了一台 50 量子比特的通用量子计算机,实现了较此前纪录 16.6 倍的加速。

原作者: Hans De Raedt, Jiri Kraus, Andreas Herten, Vrinda Mehta, Mathis Bode, Markus Hrywniak, Kristel Michielsen, Thomas Lippert

发布于 2026-05-21
📖 1 分钟阅读🧠 深度阅读

原作者: Hans De Raedt, Jiri Kraus, Andreas Herten, Vrinda Mehta, Mathis Bode, Markus Hrywniak, Kristel Michielsen, Thomas Lippert

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正在尝试解开一个谜题:每增加一块拼图,整个谜题所有可能的排列方式就会翻倍。如果你有 10 块拼图,这还 manageable(可控)。但如果你有 50 块拼图,可能性的数量如此庞大,以至于即使地球上所有计算机协同工作数十亿年,也无法逐一检查它们。这就是模拟量子计算机所面临的挑战。

本文描述了一支位于德国于利希超级计算中心(Jülich Supercomputing Centre)的科学家团队,与英伟达(NVIDIA)合作,构建了一款名为JUQCS-50的“超级模拟器”。他们利用欧洲首台“艾级”(Exascale)超级计算机(名为 JUPITER),首次成功模拟了一台 50 量子比特的量子计算机。

以下是他们如何实现这一壮举的简要说明,通过简单的类比来解释:

1. 问题:“内存墙”

要模拟一台量子计算机,你需要存储一个庞大的数字列表(称为“状态向量”),它代表了系统所有可能的状态。

  • 类比:想象你要存储一个图书馆的藏书。对于小型量子计算机(48 量子比特),这个图书馆可以容纳在几块硬盘上。但对于 50 量子比特的计算机,这个图书馆如此巨大,以至于会填满一座小型城市大小的仓库。
  • 限制:他们使用的超级计算机(JUPITER)拥有极其快速的内存(如同一辆高速跑车),但即便如此,其容量也不足以一次性容纳整个 50 量子比特的“图书馆”。

2. 解决方案:三个“魔法技巧”

为了将这个巨大的图书馆塞进可用空间并快速运行,团队运用了三个巧妙的技巧:

技巧一:“共享背包”(异构内存)

通常,计算机有一个小但超快的“背包”(GPU 内存)和一个更大但稍慢的“背包”(CPU 内存)。旧的方法是只使用那个快的。

  • 创新:团队意识到可以将这两个“背包”视为一个巨大的连续空间。他们在 CPU 和 GPU 之间构建了一座超高速桥梁(称为 NVLink)。
  • 结果:他们可以在需要时将数据存储在更大但较慢的“背包”中,但在计算时能瞬间将其移入快速“背包”。这就像在你的车间旁边建了一个仓库;你把大部分工具存放在仓库里,但有一条传送带能在瞬间将它们送到你的工作台上。

技巧二:“压缩的 ZIP 文件”(自适应字节编码)

以完整的高精度格式(如高分辨率照片)存储这些数字会占用过多空间。

  • 创新:团队开发了一种“压缩”数据的方法。他们将数字压缩到更小的尺寸(就像将高分辨率照片缩略图化),刚好足以放入内存,但又足够智能,以便在需要进行数学运算时,能瞬间将它们“解压”回全精度。
  • 结果:这将所需的内存减少了8 倍,使他们能够将 50 量子比特的模拟放入可用空间,同时不损失答案的准确性。

技巧三:“交通指挥员”(即时优化器)

当数千台计算机协同工作时,它们必须不断互相通信。如果它们都试图同时通信,网络就会拥堵(交通堵塞)。

  • 创新:软件充当了一位聪明的交通指挥员。它观察谜题的下一步,并精确决定何时发送以及发送什么数据,从而让计算机在数据后台传输的同时始终保持工作状态。
  • 结果:这最大限度地减少了计算机相互等待的时间,使模拟运行更加流畅。

3. 结果:破纪录的运行

通过在 JUPITER 超级计算机(使用 16,384 个强大的“超级芯片”)上结合这些技巧,团队实现了前所未有的成就:

  • 速度:他们模拟 50 量子比特计算机的速度比之前由另一台超级计算机(K 计算机)保持的世界纪录快了16.6 倍
  • 效率:通常情况下,随着量子比特的增加,模拟时间会呈指数级爆炸式增长,但他们的系统成功地将时间增长控制在几乎线性的范围内。这就像他们找到了一种方法,让汽车载的乘客越多反而跑得越快,而不是变慢。

4. 为什么这很重要(根据论文所述)

论文强调,这是一次模拟,而非真实的量子计算机。

  • “完美”实验室:当今真实的量子计算机充满噪声且容易出错。这个模拟器提供了一个 50 量子比特计算机的“完美”版本。
  • 基准测试:它允许科学家测试新的量子算法(例如用于化学或优化的算法),并观察理想结果应该是什么。这有助于他们找出如何修正真实物理量子机器中的错误。
  • 应用:团队专门在“加法器电路”(数学问题)上测试了这一点,发现即使使用了数据压缩技巧,数学计算结果依然完全正确。

总结:团队构建了一台数字“时间机器”,能够完美模拟一台 50 量子比特的量子计算机。他们通过巧妙地扩展庞大超级计算机的内存,并如此高效地组织数据流量,从而打破了之前的速度和规模纪录,为科学家提供了一台强大的新工具,用于设计和测试未来的量子技术。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →