Reinforcement Learning Control of Quantum Error Correction

该研究提出并实验验证了一种将量子误差校正与强化学习控制相结合的新范式,利用误差检测信号实时校准物理参数,在 Willow 超导处理器上显著提升了逻辑稳定性并创下单周期逻辑错误率新低,证明了量子计算机在持续运行中通过“从错误中学习”实现自我优化的可行性。

Volodymyr Sivak, Alexis Morvan, Michael Broughton, Rodrigo G. Cortiñas, Johannes Bausch, Andrew W. Senior, Matthew Neeley, Alec Eickbusch, Noah Shutty, Laleh Aghababaie Beni, James S. Spencer, Francisco J. H Heras, Thomas Edlich, Dmitry Abanin, Amira Abbas, Rajeev Acharya, Georg Aigeldinger, Ross Alcaraz, Sayra Alcaraz, Trond I. Andersen, Markus Ansmann, Frank Arute, Kunal Arya, Walt Askew, Nikita Astrakhantsev, Juan Atalaya, Brian Ballard, Joseph C. Bardin, Hector Bates, Andreas Bengtsson, Majid Bigdeli Karimi, Alexander Bilmes, Simon Bilodeau, Felix Borjans, Alexandre Bourassa, Jenna Bovaird, Dylan Bowers, Leon Brill, Peter Brooks, David A. Browne, Brett Buchea, Bob B. Buckley, Tim Burger, Brian Burkett, Nicholas Bushnell, Jamal Busnaina, Anthony Cabrera, Juan Campero, Hung-Shen Chang, Silas Chen, Ben Chiaro, Liang-Ying Chih, Agnetta Y. Cleland, Bryan Cochrane, Matt Cockrell, Josh Cogan, Roberto Collins, Paul Conner, Harold Cook, William Courtney, Alexander L. Crook, Ben Curtin, Martin Damyanov, Sayan Das, Dripto M. Debroy, Sean Demura, Paul Donohoe, Ilya Drozdov, Andrew Dunsworth, Valerie Ehimhen, Aviv Moshe Elbag, Lior Ella, Mahmoud Elzouka, David Enriquez, Catherine Erickson, Vinicius S. Ferreira, Marcos Flores, Leslie Flores Burgos, Ebrahim Forati, Jeremiah Ford, Austin G. Fowler, Brooks Foxen, Masaya Fukami, Alan Wing Lun Fung, Lenny Fuste, Suhas Ganjam, Gonzalo Garcia, Christopher Garrick, Robert Gasca, Helge Gehring, Robert Geiger, Élie Genois, William Giang, Dar Gilboa, James E. Goeders, Edward C. Gonzales, Raja Gosula, Stijn J. de Graaf, Alejandro Grajales Dau, Dietrich Graumann, Joel Grebel, Alex Greene, Jonathan A. Gross, Jose Guerrero, Loïck Le Guevel, Tan Ha, Steve Habegger, Tanner Hadick, Ali Hadjikhani, Michael C. Hamilton, Matthew P. Harrigan, Sean D. Harrington, Jeanne Hartshorn, Stephen Heslin, Paula Heu, Oscar Higgott, Reno Hiltermann, Hsin-Yuan Huang, Mike Hucka, Christopher Hudspeth, Ashley Huff, William J. Huggins, Evan Jeffrey, Shaun Jevons, Zhang Jiang, Xiaoxuan Jin, Chaitali Joshi, Pavol Juhas, Andreas Kabel, Dvir Kafri, Hui Kang, Kiseo Kang, Amir H. Karamlou, Ryan Kaufman, Kostyantyn Kechedzhi, Tanuj Khattar, Mostafa Khezri, Seon Kim, Can M. Knaut, Bryce Kobrin, Fedor Kostritsa, John Mark Kreikebaum, Ryuho Kudo, Ben Kueffler, Arun Kumar, Vladislav D. Kurilovich, Vitali Kutsko, Nathan Lacroix, David Landhuis, Tiano Lange-Dei, Brandon W. Langley, Pavel Laptev, Kim-Ming Lau, Justin Ledford, Joy Lee, Kenny Lee, Brian J. Lester, Wendy Leung, Lily Li, Wing Yan Li, Ming Li, Alexander T. Lill, William P. Livingston, Matthew T. Lloyd, Aditya Locharla, Laura De Lorenzo, Daniel Lundahl, Aaron Lunt, Sid Madhuk, Aniket Maiti, Ashley Maloney, Salvatore Mandrà, Leigh S. Martin, Orion Martin, Eric Mascot, Paul Masih Das, Dmitri Maslov, Melvin Mathews, Cameron Maxfield, Jarrod R. McClean, Matt McEwen, Seneca Meeks, Kevin C. Miao, Zlatko K. Minev, Reza Molavi, Sebastian Molina, Shirin Montazeri, Charles Neill, Michael Newman, Anthony Nguyen, Murray Nguyen, Chia-Hung Ni, Murphy Yuezhen Niu, Logan Oas, Raymond Orosco, Kristoffer Ottosson, Alice Pagano, Agustin Di Paolo, Sherman Peek, David Peterson, Alex Pizzuto, Elias Portoles, Rebecca Potter, Orion Pritchard, Michael Qian, Chris Quintana, Arpit Ranadive, Matthew J. Reagor, Rachel Resnick, David M. Rhodes, Daniel Riley, Gabrielle Roberts, Roberto Rodriguez, Emma Ropes, Lucia B. De Rose, Eliott Rosenberg, Emma Rosenfeld, Dario Rosenstock, Elizabeth Rossi, Pedram Roushan, David A. Rower, Robert Salazar, Kannan Sankaragomathi, Murat Can Sarihan, Kevin J. Satzinger, Max Schaefer, Sebastian Schroeder, Henry F. Schurkus, Aria Shahingohar, Michael J. Shearn, Aaron Shorter, Vladimir Shvarts, Spencer Small, W. Clarke Smith, David A. Sobel, Barrett Spells, Sofia Springer, George Sterling, Jordan Suchard, Aaron Szasz, Alexander Sztein, Madeline Taylor, Jothi Priyanka Thiruraman, Douglas Thor, Dogan Timucin, Eifu Tomita, Alfredo Torres, M. Mert Torunbalci, Hao Tran, Abeer Vaishnav, Justin Vargas, Sergey Vdovichev, Guifre Vidal, Catherine Vollgraff Heidweiller, Meghan Voorhees, Steven Waltman, Jonathan Waltz, Shannon X. Wang, Brayden Ware, James D. Watson, Yonghua Wei, Travis Weidel, Theodore White, Kristi Wong, Bryan W. K. Woo, Christopher J. Wood, Maddy Woodson, Cheng Xing, Z. Jamie Yao, Ping Yeh, Bicheng Ying, Juhwan Yoo, Noureldin Yosri, Elliot Young, Grayson Young, Adam Zalcman, Ran Zhang, Yaxing Zhang, Ningfeng Zhu, Nicholas Zobrist, Zhenjie Zou, Ryan Babbush, Dave Bacon, Sergio Boixo, Yu Chen, Zijun Chen, Michel Devoret, Monica Hansen, Jeremy Hilton, Cody Jones, Julian Kelly, Alexander N. Korotkov, Erik Lucero, Anthony Megrant, Hartmut Neven, William D. Oliver, Ganesh Ramachandran, Vadim Smelyanskiy, Paul V. Klimov

发布于 Tue, 10 Ma
📖 1 分钟阅读🧠 深度阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个非常激动人心的突破:谷歌的量子计算机现在学会了“边工作边自我修复”,不再需要停下来“体检”了。

为了让你轻松理解,我们可以把量子计算机想象成一辆极其精密、但非常娇气的超级跑车

1. 以前的困境:娇气的跑车与频繁的停车

量子计算机(特别是超导量子芯片)就像这辆跑车,它的引擎(量子比特)非常敏感。只要外界有一点点温度变化、电压波动(也就是论文里说的“环境漂移”),引擎的调校就会跑偏,导致车子跑不动或者跑错路。

  • 旧方法(停车校准): 以前,为了让车跑准,工程师必须完全停止计算,把车开进修理厂,花很长时间重新校准每一个零件(频率、振幅等)。校准完再开出来继续跑。
    • 问题: 未来的量子算法可能需要连续运行几天甚至几周。如果每跑一小时就停下来校准一次,那这辈子都算不出结果了。这就像你要跑马拉松,却每跑一公里就要停下来重新系鞋带、调整呼吸,根本跑不完。

2. 新的解决方案:给跑车装上“自动驾驶 AI"

谷歌这次做了一件很酷的事:他们给这辆跑车装上了一个强化学习(RL)的 AI 教练

  • 核心创意: 以前,量子纠错(QEC)就像是一个报警器。当系统出错时,报警器会响(检测到错误信号),然后系统去修正逻辑状态。
  • 现在的创新: 这个 AI 教练不仅听报警器响,还把报警器的响声当作“学习信号”
    • 比喻: 想象你在学骑自行车。以前,你摔倒了(出错),教练(人类专家)会停下来帮你扶正,然后让你重新骑。
    • 现在: 你骑行的过程中,只要车把稍微歪了一点(报警器响),AI 教练立刻感觉到,并微调你的身体姿势(调整控制参数),让你马上变回平衡状态。你从来没有停下来,一直在骑,而且越骑越稳。

3. 他们是怎么做到的?(三个关键步骤)

A. 把“错误”变成“老师”

在量子世界里,错误检测就像是在玩一个巨大的拼图游戏。

  • 传统做法: 发现拼图拼错了,就停下来重新找正确的拼法。
  • AI 做法: AI 发现拼图边缘有点歪(错误信号),它不需要知道具体哪块拼错了,它只需要知道“往左推一点”还是“往右推一点”能让边缘变直。它通过不断尝试微小的调整,发现哪种调整能让“歪斜”变少,从而学会如何控制整个系统。

B. 像“调音师”一样微调

量子计算机有几千个控制旋钮(参数)。

  • 以前: 人类专家像调音师一样,一个一个旋钮去试,非常慢,而且一旦环境变了,之前的调音就失效了。
  • 现在: AI 同时微调这几千个旋钮。它不需要知道物理公式,它只知道:“如果我同时把旋钮 A 调大一点,旋钮 B 调小一点,错误信号就会减少。”它通过成千上万次的试错,找到了完美的平衡点。

C. 对抗“漂移”

环境变化就像逆风

  • 固定政策: 如果你设定好方向盘就不动,逆风一来,车就会偏离路线。
  • AI 实时转向: 这个 AI 教练能感觉到风(漂移)的变化,并实时微调方向盘。论文显示,即使人为地制造强烈的“逆风”(注入漂移),AI 也能让车子保持直线行驶,稳定性提高了 3.5 倍

4. 成果有多厉害?

  • 打破纪录: 他们在谷歌最新的 Willow 芯片上,把量子纠错的“错误率”降到了历史最低。
  • 可扩展性: 他们还在电脑里模拟了更大规模的量子计算机(距离 15 的表面码,涉及数万个参数)。结果显示,无论系统变得多大,这个 AI 的学习速度不会变慢。这意味着,未来即使量子计算机有百万个量子比特,这个 AI 依然能管得过来。
  • 从“乱”到“治”: 最惊人的是,即使他们故意把控制参数全部打乱(让车子彻底失控),AI 也能从零开始,重新学会控制,把性能恢复到专家调校的水平。

5. 总结:量子计算的新纪元

这篇论文的核心思想是:让量子计算机学会“从错误中学习”。

以前,我们依赖人类专家在后台默默维护,一旦出错就停机。
现在,我们赋予了量子计算机自我进化的能力。它像一个不知疲倦的赛车手,在赛道上(计算过程中)实时感知路况,微调操作,永不停歇地向前奔跑

这不仅是技术的进步,更是范式的转变:未来的量子计算机将不再是脆弱、需要频繁呵护的婴儿,而是一个聪明、强壮、能自我适应的成年人。这是通往“容错量子计算”(即真正能解决复杂问题的量子计算机)的关键一步。