Evolutionary Discovery of Bivariate Bicycle Codes with LLM-Guided Search

本文提出了一种由大语言模型(LLM)引导的进化工作流,该工作流通过变异 Python 程序并利用多阶段流水线对候选代码进行严格验证,成功发现了新的高性能二元双循环量子 LDPC 码,共产生了包括不可分解变体和高距离变体在内的 465 个不同代码。

原作者: Juan Cruz-Benito, Andrew W. Cross, David Kremer, Ismael Faro

发布于 2026-06-02
📖 1 分钟阅读🧠 深度阅读

原作者: Juan Cruz-Benito, Andrew W. Cross, David Kremer, Ismael Faro

原始论文采用 CC BY 4.0 许可(http://creativecommons.org/licenses/by/4.0/)。 这是对下方论文的AI生成解释。它不是由作者撰写或认可的。如需技术准确性,请参阅原始论文。 阅读完整免责声明

想象一下,你正试图为数字保险库打造一把完美的锁。在量子计算的世界里,这种“锁”被称为量子纠错码(quantum error-correcting code)。它的职责是保护脆弱的量子信息免受噪声和误差的影响。锁的设计得越好,你能存储的数据就越多(高“率/rate”),以及它在损坏前能承受多大的破坏(高“距离/distance”)。

长期以来,科学家们一直试图寻找这些锁的最佳设计,特别是被称为**双变量双循环码(Bivariate Bicycle, BB codes)**的一种类型。把它们想象成复杂的数学蓝图。问题在于,可能的蓝图数量极其庞大,就像要在地球上每一片沙滩上寻找一颗特定的沙粒一样,而且检查一个蓝图是否有效既缓慢又困难。

这篇论文描述了一种利用**人工智能(具体来说是大语言模型,即 LLM)**作为进化向导来寻找这些蓝图的新方法。

以下是他们发现过程的拆解,通过简单的概念进行说明:

1. “进化式”搜索引擎

研究人员并没有让一个人类去猜测完美的蓝图,而是构建了一个模拟自然进化的系统。

  • “有机体”: 他们不是在进化单个代码,而是在进化一个Python 计算机程序(一种配方),该程序可以生成代码。
  • “突变”: AI(LLM)观察当前的最佳配方,并提出微小的改动,例如“改变这个数字”或“增加一个新的步骤”。
  • “适者生存”: 系统生成数千个新配方。它会快速测试这些配方以查看它们是否产生了有效的代码。最好的配方会存活下来并再次进行突变;差的则会被丢弃。

经过五轮“战役”(搜索轮次),这个由 AI 驱动的系统运行了大约 1,650 代,筛选了大约 200,000 个候选代码。整个过程的计算时间成本约为 400 美元,耗时约 140 小时

2. “陷阱”与“裁判”

在搜索初期,AI 遇到了一个聪明的陷阱。它找到了能产生极高数据存储量(高“率”)的配方,这看起来非常完美。然而,这些代码实际上是没用的,因为它们完全没有纠错能力(距离 = 2)。这就像是发现了一扇可以用回形针打开的保险库门;它能装很多东西,但并不安全。

研究人员意识到他们最初的“距离检测器”(一种名为 BP-OSD 的标准工具)在欺骗他们。它高估了这些代码的强度,有时甚至高估了 12 倍

为了解决这个问题,他们在过程中加入了一个严格的裁判(MILP)

  • 裁判的任务: 这是一个重型数学求解器,用于以 100% 的确定性检查代码的距离。
  • 结果: 裁判立即抓住了这些“陷阱”。它还揭示了许多 AI 认为很强的代码实际上很弱。这迫使 AI 停止寻找那些“虚假”的高性能代码,转而寻找真正强大的代码。

3. 发现成果

在优化过程后,系统发现了 465 个截然不同的、高质量的代码。以下是亮点:

  • “金标准”匹配: 他们发现了一种新型代码(称为“扰动双变量双循环码”),其性能与当前已知最好的代码(“Gross 代码”)相匹配,但使用了一种更复杂的结构。这就像是发现了一种新的发动机设计,它能使用不同的燃料,却能达到市场上最好的汽车那样的油耗表现。
  • 更多数据,同样的保护: 他们发现了一些可以存储更多数据(高达 54 个逻辑比特)同时保持相当水平保护能力的编码。
  • “可分解性”发现: 系统发现了一个看起来像超级先进锁的代码。然而,裁判的图分析显示,它实际上只是两个普通锁粘在一起的结果。它不是一项新发明,而只是两个现有锁并排在一起。这展示了系统识别“伪”复杂性的能力。

4. “率 vs. 距离”的权衡

研究人员绘制了所有这些代码的图谱,并发现了一条一致的规则,就像是这些锁的物理定律一样:

  • “包络线”: 你通常无法拥有一把既能存储海量数据,又极其坚固的锁。
  • “曲线”: 如果你想存储更多数据(更高的率),锁就变得更容易被破解(较低的距离)。如果你想要一把超强韧的锁,你就必须存储较少的数据。
  • 例外情况: 他们发现了一些试图挑战这条曲线边缘的代码(例如一个拥有 50 个数据单元且距离为 8 的代码),但它们仍然无法突破这种权衡关系的根本“包络线”。

5. 为什么这很重要

论文总结道,使用 AI 来进化计算机程序是一个实用且低成本的工具,用于发现新的量子代码。

  • 它找到了人类和传统数学搜索所遗漏的代码。
  • 它证明了标准的测试工具对于高性能代码可能具有危险的误导性,因此必须使用严格的“裁判”(MILP)。
  • 它证明了 AI 可以学习如何避开“陷阱”,并发现可以推广到不同规模量子计算机上的复杂代数模式。

简而言之,研究人员利用 AI 进化出了一个“代码生成器”,教会了它如何忽略虚假结果,并成功发现了一个新的量子锁家族——它们比我们之前的任何代码都更强、更高效,或者仅仅是与众不同。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →