Benchmarking Quantum Computers via Protocols, Comparing IBM's Heron vs IBM's Eagle

本文通过应用基于协议的基准测试方法,对比评估了 IBM 的 Eagle 与 Heron 量子处理器,证实了 Heron 架构在操作性能上的显著提升,并展示了该方法在直观判断量子处理器是否具备实用量子优势方面的有效性。

Nitay Mayo, Tal Mor, Yossi Weinstein

发布于 2026-03-05
📖 1 分钟阅读🧠 深度阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一份**“量子计算机的体检报告”,而且不是那种只测心跳(基础指标)的简单体检,而是一场“实战演习”**。

作者来自以色列的理工科大学,他们想搞清楚 IBM 最新的量子计算机(代号“金斯顿”,Heron 架构)和旧款(代号“布里斯班”,Eagle 架构)到底谁更厉害。

为了让你更容易理解,我们可以把量子计算机想象成一个巨大的、由许多小房间(量子比特)组成的迷宫城市

1. 他们是怎么测试的?(“协议”就是“任务清单”)

以前,人们测试量子计算机就像是在检查每个灯泡亮不亮(门级测试)。但这篇论文的作者说:“别光看灯泡,要看整个房间能不能住人!”

他们设计了一套**“任务清单”(协议)**,就像给迷宫里的探险队布置任务:

  • 什么都不做(Do-nothing): 就像让你站在原地不动,看你能不能保持平衡。这是最基础的测试。
  • 传送状态(Transmit): 就像让你把一张纸条从房间 A 传到房间 B,中间要经过很多走廊。
  • 量子隐形传态(Teleportation): 就像把房间 A 的“灵魂”瞬间复制到房间 B,同时把 A 的“灵魂”抹去。
  • 超密编码(Super-dense coding): 就像用极少的空间传递更多的信息。
  • 纠缠交换(Entanglement swapping): 就像让两个从未见过面的陌生人(量子比特)瞬间产生心灵感应。

核心逻辑: 如果连最简单的“站在原地”都做不到,那复杂的“传送灵魂”肯定更不行。所以,他们设计了一个**“层层筛选”**的流程(Optimal Lookup Workflow):

  1. 先测最基础的“原地不动”。
  2. 只有通过了这一关的“小房间”,才有资格去测更难的“传送”。
  3. 最后,把通过所有测试的“小房间”拼成一个大团队,看看能不能一起干活。

2. 发现了什么?(“布里斯班” vs“金斯顿”)

旧款选手:布里斯班(Brisbane / Eagle 架构)

  • 表现: 就像是一个刚装修完、还没通水电的老房子
  • 问题: 很多房间连“原地不动”都做不到。当你试图把信息从一个房间传到另一个房间(哪怕只隔几个房间),信号就断了,或者完全乱套。
  • 结果: 在复杂的任务(如量子隐形传态、纠缠交换)中,布里斯班几乎全军覆没。它虽然有很多房间(127 个量子比特),但真正能用的“好房间”寥寥无几,而且很难把它们连起来组成一个大团队。
  • 有趣插曲: 作者在测试过程中发现,IBM 悄悄升级了布里斯班的硬件(就像给老房子换了新水管),性能确实变好了,但即便如此,它还是打不过新款。

新款选手:金斯顿(Kingston / Heron 架构)

  • 表现: 就像是一个现代化的、设施齐全的高科技公寓
  • 优势: 大部分房间都能轻松完成“原地不动”和“传送纸条”的任务。
  • 结果:
    • 在“原地不动”测试中,金斯顿有11 个房间能完美通过,而布里斯班只有6 个
    • 在更难的“量子隐形传态”任务中,金斯顿有11 个房间和19 对房间组合能成功,而布里斯班只有4 个房间能勉强做到。
    • 在布里斯班完全失败的“纠缠交换”和“超密编码”任务中,金斯顿竟然有一半的房间能成功完成!

3. 核心结论:不仅仅是“更快”,而是“能用”

这篇论文最核心的观点是:量子计算机的进步不仅仅是“比特数量”的增加,而是“质量”的飞跃。

  • 旧款(布里斯班): 就像买了一辆有很多轮子的卡车,但大部分轮子是坏的,车根本跑不起来。你只能找到几个能转的轮子,勉强推一下。
  • 新款(金斯顿): 不仅轮子多,而且大部分轮子都能转,甚至能组成一个车队,去执行复杂的运输任务。

作者通过这种“实战演习”发现,IBM 的新一代芯片(Heron)在稳定性可用性上有了质的飞跃。以前我们只能看到芯片上有多少个量子比特(就像数有多少个房间),现在我们知道哪些房间是真正“能住人”的,哪些房间可以连起来组成“豪华套房”。

4. 为什么这很重要?

这就好比在买电脑。以前我们只看 CPU 主频(理论速度),现在我们要看它能不能流畅运行大型游戏(实际任务)。

这篇论文告诉我们:

  1. 别只看数量: 100 个坏掉的量子比特不如 10 个好用的。
  2. 硬件在进步: IBM 确实在努力,新款芯片已经具备了处理复杂量子任务的潜力。
  3. 未来的方向: 未来的量子计算研究,不应该只盯着整个芯片,而应该像作者建议的那样,“优中选优”,找出芯片里那些表现最好的“小团队”(子芯片)来专门干活。

一句话总结:
这篇论文就像给量子计算机做了一次**“深度体检”**,发现旧款(布里斯班)虽然身体零件多,但很多都“瘫痪”了;而新款(金斯顿)不仅零件多,而且大部分都“活蹦乱跳”,真正具备了干大事的能力。