Reinforcement Learning Control of Quantum Error Correction

Este trabajo presenta un marco de aprendizaje por refuerzo que unifica la calibración y la computación cuántica, demostrando experimentalmente en un procesador superconductor Willow una mejora de 3,5 veces en la estabilidad lógica y un rendimiento récord al permitir que el sistema aprenda de sus errores para estabilizarse continuamente sin detener el cálculo.

Volodymyr Sivak, Alexis Morvan, Michael Broughton, Rodrigo G. Cortiñas, Johannes Bausch, Andrew W. Senior, Matthew Neeley, Alec Eickbusch, Noah Shutty, Laleh Aghababaie Beni, James S. Spencer, Francisco J. H Heras, Thomas Edlich, Dmitry Abanin, Amira Abbas, Rajeev Acharya, Georg Aigeldinger, Ross Alcaraz, Sayra Alcaraz, Trond I. Andersen, Markus Ansmann, Frank Arute, Kunal Arya, Walt Askew, Nikita Astrakhantsev, Juan Atalaya, Brian Ballard, Joseph C. Bardin, Hector Bates, Andreas Bengtsson, Majid Bigdeli Karimi, Alexander Bilmes, Simon Bilodeau, Felix Borjans, Alexandre Bourassa, Jenna Bovaird, Dylan Bowers, Leon Brill, Peter Brooks, David A. Browne, Brett Buchea, Bob B. Buckley, Tim Burger, Brian Burkett, Nicholas Bushnell, Jamal Busnaina, Anthony Cabrera, Juan Campero, Hung-Shen Chang, Silas Chen, Ben Chiaro, Liang-Ying Chih, Agnetta Y. Cleland, Bryan Cochrane, Matt Cockrell, Josh Cogan, Roberto Collins, Paul Conner, Harold Cook, William Courtney, Alexander L. Crook, Ben Curtin, Martin Damyanov, Sayan Das, Dripto M. Debroy, Sean Demura, Paul Donohoe, Ilya Drozdov, Andrew Dunsworth, Valerie Ehimhen, Aviv Moshe Elbag, Lior Ella, Mahmoud Elzouka, David Enriquez, Catherine Erickson, Vinicius S. Ferreira, Marcos Flores, Leslie Flores Burgos, Ebrahim Forati, Jeremiah Ford, Austin G. Fowler, Brooks Foxen, Masaya Fukami, Alan Wing Lun Fung, Lenny Fuste, Suhas Ganjam, Gonzalo Garcia, Christopher Garrick, Robert Gasca, Helge Gehring, Robert Geiger, Élie Genois, William Giang, Dar Gilboa, James E. Goeders, Edward C. Gonzales, Raja Gosula, Stijn J. de Graaf, Alejandro Grajales Dau, Dietrich Graumann, Joel Grebel, Alex Greene, Jonathan A. Gross, Jose Guerrero, Loïck Le Guevel, Tan Ha, Steve Habegger, Tanner Hadick, Ali Hadjikhani, Michael C. Hamilton, Matthew P. Harrigan, Sean D. Harrington, Jeanne Hartshorn, Stephen Heslin, Paula Heu, Oscar Higgott, Reno Hiltermann, Hsin-Yuan Huang, Mike Hucka, Christopher Hudspeth, Ashley Huff, William J. Huggins, Evan Jeffrey, Shaun Jevons, Zhang Jiang, Xiaoxuan Jin, Chaitali Joshi, Pavol Juhas, Andreas Kabel, Dvir Kafri, Hui Kang, Kiseo Kang, Amir H. Karamlou, Ryan Kaufman, Kostyantyn Kechedzhi, Tanuj Khattar, Mostafa Khezri, Seon Kim, Can M. Knaut, Bryce Kobrin, Fedor Kostritsa, John Mark Kreikebaum, Ryuho Kudo, Ben Kueffler, Arun Kumar, Vladislav D. Kurilovich, Vitali Kutsko, Nathan Lacroix, David Landhuis, Tiano Lange-Dei, Brandon W. Langley, Pavel Laptev, Kim-Ming Lau, Justin Ledford, Joy Lee, Kenny Lee, Brian J. Lester, Wendy Leung, Lily Li, Wing Yan Li, Ming Li, Alexander T. Lill, William P. Livingston, Matthew T. Lloyd, Aditya Locharla, Laura De Lorenzo, Daniel Lundahl, Aaron Lunt, Sid Madhuk, Aniket Maiti, Ashley Maloney, Salvatore Mandrà, Leigh S. Martin, Orion Martin, Eric Mascot, Paul Masih Das, Dmitri Maslov, Melvin Mathews, Cameron Maxfield, Jarrod R. McClean, Matt McEwen, Seneca Meeks, Kevin C. Miao, Zlatko K. Minev, Reza Molavi, Sebastian Molina, Shirin Montazeri, Charles Neill, Michael Newman, Anthony Nguyen, Murray Nguyen, Chia-Hung Ni, Murphy Yuezhen Niu, Logan Oas, Raymond Orosco, Kristoffer Ottosson, Alice Pagano, Agustin Di Paolo, Sherman Peek, David Peterson, Alex Pizzuto, Elias Portoles, Rebecca Potter, Orion Pritchard, Michael Qian, Chris Quintana, Arpit Ranadive, Matthew J. Reagor, Rachel Resnick, David M. Rhodes, Daniel Riley, Gabrielle Roberts, Roberto Rodriguez, Emma Ropes, Lucia B. De Rose, Eliott Rosenberg, Emma Rosenfeld, Dario Rosenstock, Elizabeth Rossi, Pedram Roushan, David A. Rower, Robert Salazar, Kannan Sankaragomathi, Murat Can Sarihan, Kevin J. Satzinger, Max Schaefer, Sebastian Schroeder, Henry F. Schurkus, Aria Shahingohar, Michael J. Shearn, Aaron Shorter, Vladimir Shvarts, Spencer Small, W. Clarke Smith, David A. Sobel, Barrett Spells, Sofia Springer, George Sterling, Jordan Suchard, Aaron Szasz, Alexander Sztein, Madeline Taylor, Jothi Priyanka Thiruraman, Douglas Thor, Dogan Timucin, Eifu Tomita, Alfredo Torres, M. Mert Torunbalci, Hao Tran, Abeer Vaishnav, Justin Vargas, Sergey Vdovichev, Guifre Vidal, Catherine Vollgraff Heidweiller, Meghan Voorhees, Steven Waltman, Jonathan Waltz, Shannon X. Wang, Brayden Ware, James D. Watson, Yonghua Wei, Travis Weidel, Theodore White, Kristi Wong, Bryan W. K. Woo, Christopher J. Wood, Maddy Woodson, Cheng Xing, Z. Jamie Yao, Ping Yeh, Bicheng Ying, Juhwan Yoo, Noureldin Yosri, Elliot Young, Grayson Young, Adam Zalcman, Ran Zhang, Yaxing Zhang, Ningfeng Zhu, Nicholas Zobrist, Zhenjie Zou, Ryan Babbush, Dave Bacon, Sergio Boixo, Yu Chen, Zijun Chen, Michel Devoret, Monica Hansen, Jeremy Hilton, Cody Jones, Julian Kelly, Alexander N. Korotkov, Erik Lucero, Anthony Megrant, Hartmut Neven, William D. Oliver, Ganesh Ramachandran, Vadim Smelyanskiy, Paul V. Klimov

Publicado Tue, 10 Ma
📖 4 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un orquestador de un concierto de música clásica (el ordenador cuántico) que intenta tocar una sinfonía perfecta. El problema es que los instrumentos (los qubits) son extremadamente delicados; se desintonizan con el mínimo cambio de temperatura, vibración o incluso por el paso del tiempo. Si un violín se desafina, toda la música suena mal.

En el mundo de la computación cuántica, esto se llama "deriva" (drift). Tradicionalmente, la solución era detener la orquesta completa, pedir a los músicos que se calibren uno por uno durante horas, y luego volver a empezar. Pero si la sinfonía dura días o semanas (como los algoritmos del futuro), parar constantemente es imposible.

Google Quantum AI y Google DeepMind han encontrado una solución brillante que cambia las reglas del juego. Han creado un sistema donde el ordenador aprende de sus propios errores mientras sigue tocando la música, sin detenerse nunca.

Aquí te explico cómo funciona, usando analogías sencillas:

1. El problema: El "ruido" que arruina la fiesta

Los ordenadores cuánticos son máquinas analógicas, no digitales como los nuestros. Son como un vaso de agua lleno hasta el borde: cualquier pequeño movimiento (ruido ambiental) hace que se derrame. Para proteger la información, usan un código de seguridad llamado Corrección de Errores Cuánticos (QEC).

  • La analogía: Imagina que tienes un equipo de guardias (el código de corrección) que vigilan el vaso de agua. Si ven una gota caer, gritan "¡Error!".
  • El problema: Los guardias gritan, pero no saben por qué se cayó la gota. ¿Fue el viento? ¿Fue un temblor? ¿Fue que el vaso estaba mal colocado? Si no ajustamos el vaso (calibración), seguirán cayendo gotas.

2. La vieja solución: Parar y arreglar

Antes, cuando los guardias empezaban a gritar demasiado, la única solución era parar la sinfonía, apagar la música, y mandar a un técnico experto a ajustar cada tornillo de cada instrumento. Esto funcionaba, pero era lento y costoso. No servía para tareas largas.

3. La nueva solución: El "Entrenador con IA" (Aprendizaje por Refuerzo)

En este nuevo trabajo, han creado un entrenador virtual (un agente de Inteligencia Artificial) que tiene dos trabajos a la vez:

  1. Escuchar a los guardias: Cuando el código de corrección detecta un error (una gota que cae), el entrenador no solo corrige el error, sino que aprende de él.
  2. Ajustar los instrumentos en tiempo real: El entrenador usa esa información para mover sutilmente los controles de los instrumentos (frecuencias, amplitudes) para que dejen de caer gotas.

¿Cómo lo hace?
Imagina que el entrenador es un chef que prueba la sopa constantemente.

  • En lugar de parar la cocina para probar, el chef prueba una cucharada (detecta un error).
  • Si la sopa está salada, el chef no solo añade agua; aprende que la sal se disolvió mal o que la fuente de sal estaba mal regulada.
  • Luego, el chef ajusta sutilmente la válvula de la sal mientras sigue cocinando.
  • Con el tiempo, el chef se vuelve un experto en mantener el sabor perfecto, incluso si la temperatura de la cocina cambia.

4. El truco: "Aprender de los errores"

Lo genial es que el ordenador no necesita un manual de instrucciones ni un humano experto para decirle qué hacer.

  • El sistema genera pequeños "ruidos" o cambios aleatorios en sus controles.
  • Observa si esos cambios hacen que los guardias griten más o menos.
  • Si los guardias gritan menos, el sistema dice: "¡Genial! Mantengamos ese ajuste". Si gritan más, dice: "Mal, volvamos atrás".
  • Esto es lo que llaman Aprendizaje por Refuerzo (Reinforcement Learning). El sistema "juega" a ajustar los controles y recibe una "recompensa" cuando el error disminuye.

5. Los resultados: Un récord histórico

En sus experimentos con un procesador llamado Willow:

  • Estabilidad: Lograron que el sistema fuera 3.5 veces más estable contra las perturbaciones que antes.
  • Mejora automática: Incluso cuando el sistema ya estaba bien calibrado por humanos, la IA lo mejoró un 20% más, superando lo que un experto humano podía lograr solo.
  • Escalabilidad: Simularon que esto funcionaría incluso con ordenadores cuánticos gigantes (con miles de qubits), y la IA seguiría aprendiendo a la misma velocidad, sin importar el tamaño.

En resumen

Este trabajo es como pasar de tener un músico que se detiene a afinar su violín cada vez que suena mal, a tener un músico que tiene un oído sobrehumano y ajusta su instrumento con el dedo mientras toca la nota perfecta.

Ya no necesitamos detener el futuro para arreglar el presente. Hemos creado un ordenador cuántico que aprende de sus propios tropiezos para no volver a tropezar, permitiéndole trabajar sin parar durante días o semanas. Es el primer paso hacia una computadora cuántica verdaderamente inteligente y autónoma.