Scalable On-Hardware Training of Quantum Neural Networks and Application to Clinical Data Imputation

本文介绍了一种用于量子神经网络的可扩展训练框架,该框架通过协同设计的架构和并行化的参数移位规则,将梯度估计成本从二次复杂度降低至对数复杂度,并成功在 16 量子比特的 IonQ 硬件上展示了针对临床数据填补和患者生存预测的高性能实际训练。

原作者: Natansh Mathur, Panagiotis Kl. Barkoutsos, Masako Yamada, Martin Roetteler, Iordanis Kerenidis

发布于 2026-06-03
📖 1 分钟阅读🧠 深度阅读

原作者: Natansh Mathur, Panagiotis Kl. Barkoutsos, Masako Yamada, Martin Roetteler, Iordanis Kerenidis

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正在试图教一个非常特别、速度极快的机器人如何填补拼图中的缺失部分。这个机器人是一个量子神经网络(QNN)。它的设计目标是观察患者的健康记录(如生命体征),并在某些数字缺失时,猜出这些数字应该是多少。如果它猜得准,医生就能更好地预测患者是否能存活。

然而,有一个巨大的问题:教导这个机器人极其昂贵且缓慢。

问题所在:“出租车”瓶颈

通常情况下,要教导一个量子机器人,你必须让它反复运行特定的测试,才能找出改进的方法。对于一个拥有许多参数(设置)的机器人,所需的测试次数会呈二次方增长。

你可以这样理解:如果你有 10 个设置,你需要 100 次出租车行程来学习。如果你有 100 个设置,你需要 10,000 次出租车行程!在真实的量子计算机上(它们运行缓慢且租金昂贵),要求进行 10,000 次行程是不可能的。这太耗时了,也太贵了。这就是阻碍量子计算机学习大型任务的“瓶颈”。

解决方案:“蝴蝶”与“团队”

作者创建了一种全新的训练框架,将成本从“二次方”降低到了“对数级”。简单来说,他们让学习过程变得极其高效,即使是一个拥有许多设置的机器人,也只需要极少量的出租车行程。

他们通过三个聪明的技巧实现了这一点:

  1. 蝴蝶架构(高效工厂):
    与其构建一个混乱、纠缠的网络,他们将机器人的大脑构建成一种特定的模式,称为“蝴蝶”。想象一个工厂的流水线,工人们按照特定的、对称的模式排列(就像蝴蝶的翅膀)。

    • 为什么有效: 这种结构很浅(不是太深)且很有组织。这意味着机器人可以快速混合信息,而不需要数百万个步骤。它将机器人需要学习的设置数量从庞大的数字减少到了一个更小、更易处理的数量。
  2. 逐层训练(团队方法):
    与其试图一次性教导整个机器人(这会让它应接不暇),不如一层一层地教导它。

    • 类比: 想象在教一个合唱团。与其试图让 100 名歌手同时完美地学会一首歌,不如先教低音部。一旦他们掌握了自己的部分,你就让他们“冻结”(告诉他们保持不动),然后再教次中音部。接着,你冻结所有人,再去教女高音。
    • 为什么有效: 通过一次只专注于机器人的一小个“层”,计算机不会感到不知所措。这能让学习过程保持稳定且快速。
  3. 并行参数移位(小组测试):
    这是最节省时间的魔术技巧。通常,为了检查一个设置是否良好,你必须一个接一个地测试它。但由于“蝴蝶”结构的特性,一层中的设置不会互相干扰。

    • 类比: 想象一个教室,老师想要检查每个学生是否都知道答案。在普通的课堂上,老师必须逐一叫到每个学生(一个接一个)。但在这个特殊的班级里,因为学生们的座位安排不会互相干扰,老师可以同时询问整排学生一个问题,并立即得到所有答案。
    • 为什么有效: 他们不再需要为 100 个设置运行 100 次测试,而是只需运行几次测试就能获得所有答案。

现实世界测试:填补缺失的健康数据

作者将这种新方法应用于一个现实世界的问题:医疗数据填补(Medical Data Imputation)

  • 任务: 他们使用了一个患者记录数据集(MIMIC-III),其中 30% 的数据被随机删除了。目标是填补空白,以便计算机可以预测患者是否能存活。
  • 硬件: 他们直接在名为 IonQ Forte 的真实量子计算机(一种俘获离子机)上训练了 16 量子比特版本的机器人。
  • 结果:
    • 没有减速: 该机器人在真实的、带有噪声的量子硬件上训练的表现,与在完美的模拟器上训练的表现一样出色。
    • 更好的稳定性: 量子模型的表现实际上比标准的经典计算机模型更具一致性。当训练重新开始时,它不会出现剧烈波动。
    • 规模扩展: 他们还模拟了一个更大的版本(32 量子比特),并在真实硬件上运行以观察效果。结果显示,它确实可行,且性能没有损失。

核心结论

本文证明,通过将量子机器人的大脑组织成“蝴蝶”结构,并使用“小组测试”法进行逐层训练,我们终于可以实现在真实硬件上训练这些机器。

他们发现,对于这项特定的医疗任务,拥有大约 128 个量子比特 的机器人将是匹配最强经典计算机的“黄金分割点”。虽然我们目前还没达到那个阶段,但这种新的训练方法展示了一条清晰、务实的路径,证明了量子计算机最终可以成为分析患者健康记录等现实世界数据的可靠工具。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →