Reinforcement Learning Control of Quantum Error Correction

Este trabalho apresenta um novo paradigma para a computação quântica tolerante a falhas, onde um agente de aprendizado por reforço utiliza eventos de correção de erros para calibrar continuamente os parâmetros do sistema durante a execução, demonstrando experimentalmente no processador supercondutor Willow uma estabilidade lógica 3,5 vezes superior e alcançando taxas de erro recorde em códigos de superfície e de cor.

Volodymyr Sivak, Alexis Morvan, Michael Broughton, Rodrigo G. Cortiñas, Johannes Bausch, Andrew W. Senior, Matthew Neeley, Alec Eickbusch, Noah Shutty, Laleh Aghababaie Beni, James S. Spencer, Francisco J. H Heras, Thomas Edlich, Dmitry Abanin, Amira Abbas, Rajeev Acharya, Georg Aigeldinger, Ross Alcaraz, Sayra Alcaraz, Trond I. Andersen, Markus Ansmann, Frank Arute, Kunal Arya, Walt Askew, Nikita Astrakhantsev, Juan Atalaya, Brian Ballard, Joseph C. Bardin, Hector Bates, Andreas Bengtsson, Majid Bigdeli Karimi, Alexander Bilmes, Simon Bilodeau, Felix Borjans, Alexandre Bourassa, Jenna Bovaird, Dylan Bowers, Leon Brill, Peter Brooks, David A. Browne, Brett Buchea, Bob B. Buckley, Tim Burger, Brian Burkett, Nicholas Bushnell, Jamal Busnaina, Anthony Cabrera, Juan Campero, Hung-Shen Chang, Silas Chen, Ben Chiaro, Liang-Ying Chih, Agnetta Y. Cleland, Bryan Cochrane, Matt Cockrell, Josh Cogan, Roberto Collins, Paul Conner, Harold Cook, William Courtney, Alexander L. Crook, Ben Curtin, Martin Damyanov, Sayan Das, Dripto M. Debroy, Sean Demura, Paul Donohoe, Ilya Drozdov, Andrew Dunsworth, Valerie Ehimhen, Aviv Moshe Elbag, Lior Ella, Mahmoud Elzouka, David Enriquez, Catherine Erickson, Vinicius S. Ferreira, Marcos Flores, Leslie Flores Burgos, Ebrahim Forati, Jeremiah Ford, Austin G. Fowler, Brooks Foxen, Masaya Fukami, Alan Wing Lun Fung, Lenny Fuste, Suhas Ganjam, Gonzalo Garcia, Christopher Garrick, Robert Gasca, Helge Gehring, Robert Geiger, Élie Genois, William Giang, Dar Gilboa, James E. Goeders, Edward C. Gonzales, Raja Gosula, Stijn J. de Graaf, Alejandro Grajales Dau, Dietrich Graumann, Joel Grebel, Alex Greene, Jonathan A. Gross, Jose Guerrero, Loïck Le Guevel, Tan Ha, Steve Habegger, Tanner Hadick, Ali Hadjikhani, Michael C. Hamilton, Matthew P. Harrigan, Sean D. Harrington, Jeanne Hartshorn, Stephen Heslin, Paula Heu, Oscar Higgott, Reno Hiltermann, Hsin-Yuan Huang, Mike Hucka, Christopher Hudspeth, Ashley Huff, William J. Huggins, Evan Jeffrey, Shaun Jevons, Zhang Jiang, Xiaoxuan Jin, Chaitali Joshi, Pavol Juhas, Andreas Kabel, Dvir Kafri, Hui Kang, Kiseo Kang, Amir H. Karamlou, Ryan Kaufman, Kostyantyn Kechedzhi, Tanuj Khattar, Mostafa Khezri, Seon Kim, Can M. Knaut, Bryce Kobrin, Fedor Kostritsa, John Mark Kreikebaum, Ryuho Kudo, Ben Kueffler, Arun Kumar, Vladislav D. Kurilovich, Vitali Kutsko, Nathan Lacroix, David Landhuis, Tiano Lange-Dei, Brandon W. Langley, Pavel Laptev, Kim-Ming Lau, Justin Ledford, Joy Lee, Kenny Lee, Brian J. Lester, Wendy Leung, Lily Li, Wing Yan Li, Ming Li, Alexander T. Lill, William P. Livingston, Matthew T. Lloyd, Aditya Locharla, Laura De Lorenzo, Daniel Lundahl, Aaron Lunt, Sid Madhuk, Aniket Maiti, Ashley Maloney, Salvatore Mandrà, Leigh S. Martin, Orion Martin, Eric Mascot, Paul Masih Das, Dmitri Maslov, Melvin Mathews, Cameron Maxfield, Jarrod R. McClean, Matt McEwen, Seneca Meeks, Kevin C. Miao, Zlatko K. Minev, Reza Molavi, Sebastian Molina, Shirin Montazeri, Charles Neill, Michael Newman, Anthony Nguyen, Murray Nguyen, Chia-Hung Ni, Murphy Yuezhen Niu, Logan Oas, Raymond Orosco, Kristoffer Ottosson, Alice Pagano, Agustin Di Paolo, Sherman Peek, David Peterson, Alex Pizzuto, Elias Portoles, Rebecca Potter, Orion Pritchard, Michael Qian, Chris Quintana, Arpit Ranadive, Matthew J. Reagor, Rachel Resnick, David M. Rhodes, Daniel Riley, Gabrielle Roberts, Roberto Rodriguez, Emma Ropes, Lucia B. De Rose, Eliott Rosenberg, Emma Rosenfeld, Dario Rosenstock, Elizabeth Rossi, Pedram Roushan, David A. Rower, Robert Salazar, Kannan Sankaragomathi, Murat Can Sarihan, Kevin J. Satzinger, Max Schaefer, Sebastian Schroeder, Henry F. Schurkus, Aria Shahingohar, Michael J. Shearn, Aaron Shorter, Vladimir Shvarts, Spencer Small, W. Clarke Smith, David A. Sobel, Barrett Spells, Sofia Springer, George Sterling, Jordan Suchard, Aaron Szasz, Alexander Sztein, Madeline Taylor, Jothi Priyanka Thiruraman, Douglas Thor, Dogan Timucin, Eifu Tomita, Alfredo Torres, M. Mert Torunbalci, Hao Tran, Abeer Vaishnav, Justin Vargas, Sergey Vdovichev, Guifre Vidal, Catherine Vollgraff Heidweiller, Meghan Voorhees, Steven Waltman, Jonathan Waltz, Shannon X. Wang, Brayden Ware, James D. Watson, Yonghua Wei, Travis Weidel, Theodore White, Kristi Wong, Bryan W. K. Woo, Christopher J. Wood, Maddy Woodson, Cheng Xing, Z. Jamie Yao, Ping Yeh, Bicheng Ying, Juhwan Yoo, Noureldin Yosri, Elliot Young, Grayson Young, Adam Zalcman, Ran Zhang, Yaxing Zhang, Ningfeng Zhu, Nicholas Zobrist, Zhenjie Zou, Ryan Babbush, Dave Bacon, Sergio Boixo, Yu Chen, Zijun Chen, Michel Devoret, Monica Hansen, Jeremy Hilton, Cody Jones, Julian Kelly, Alexander N. Korotkov, Erik Lucero, Anthony Megrant, Hartmut Neven, William D. Oliver, Ganesh Ramachandran, Vadim Smelyanskiy, Paul V. Klimov

Publicado Tue, 10 Ma
📖 4 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está tentando manter uma casa perfeitamente organizada enquanto vive em um terremoto constante.

No mundo da computação quântica, os "quartos" são os qubits (as unidades de informação) e o "terremoto" é o ruído ambiental. Esses computadores são extremamente frágeis; qualquer pequena vibração de temperatura ou interferência elétrica pode bagunçar a informação, fazendo com que o cálculo dê errado.

Para resolver isso, os cientistas usam uma técnica chamada Correção de Erros Quânticos (QEC). Pense nisso como ter um exército de guardiões (os códigos de correção) que vigiam a casa 24 horas por dia. Se um móvel se move (um erro), os guardiões gritam: "Algo mudou aqui!". Um decodificador (o chefe) então decide como colocar o móvel de volta no lugar antes que a bagunça se espalhe.

O Problema: O "Reparo" que Para Tudo
Até agora, havia um grande problema: esses guardiões precisam que a casa esteja perfeitamente calibrada para funcionar. Com o tempo, os instrumentos de controle (os botões e alavancas que ajustam os qubits) se descalibram sozinhos, como um relógio que atrasa.
A solução antiga era: Parar tudo. Desligar o computador quântico, esperar horas para que especialistas humanos ajustassem cada botão manualmente e, só então, retomar o trabalho.
Para algoritmos futuros que precisam rodar por dias ou semanas, parar para "ajustar o relógio" a cada hora é inviável. É como tentar dirigir um carro de Fórmula 1, mas ter que parar a cada 10 minutos para trocar os pneus e calibrar o motor manualmente. O carro nunca chega ao destino.

A Solução: O Motorista que Aprende Dirigindo
A Google Quantum AI e o Google DeepMind criaram uma solução genial usando Aprendizado por Reforço (RL), uma inteligência artificial que aprende tentando e errando (como um bebê aprendendo a andar).

Eles deram um novo papel aos guardiões da casa:

  1. Antes: Os guardiões apenas gritavam "Erro!" para o decodificador corrigir o estado lógico.
  2. Agora: Os guardiões também gritam "Erro!" para o IA (o agente de RL).

A IA usa esses gritos de erro como um sinal de aprendizado. Em vez de parar o computador, a IA faz pequenos ajustes nos botões de controle enquanto o cálculo está acontecendo. É como se o motorista do carro de F1 tivesse um copiloto superinteligente que, ao ouvir o motor fazer um barulho estranho, ajusta a injeção de combustível e a direção instantaneamente, sem que o carro precise parar.

Como Funciona na Prática (A Analogia do Sintonizador de Rádio)
Imagine que você está tentando sintonizar uma rádio em uma estação específica, mas a frequência está oscilando constantemente.

  • Método Antigo: Você para de ouvir, tenta sintonizar manualmente, ouve um pouco, percebe que está fora, para de novo, ajusta... é lento e chato.
  • Método da IA: Você continua ouvindo a música. A IA percebe que a música está levemente distorcida (o "erro") e, com base nisso, faz micro-ajustes na antena em tempo real. Ela aprende qual ajuste corrige qual tipo de distorção.

Os Resultados: Um Salto Histórico
Os pesquisadores testaram isso no processador "Willow" da Google:

  • Estabilidade: O sistema conseguiu manter a estabilidade do cálculo 3,5 vezes melhor do que antes, mesmo com interferências artificiais sendo injetadas.
  • Recorde: Eles conseguiram reduzir a taxa de erros lógicos para níveis recordes (menos de 1 erro em 1.000 ciclos), superando o que era possível apenas com a calibração humana tradicional.
  • Escalabilidade: Simulações mostraram que esse método funciona mesmo se o computador crescer para ter milhares de qubits. A IA não fica mais lenta; ela continua aprendendo na mesma velocidade, independentemente do tamanho do sistema.

Por que isso é revolucionário?
Esta pesquisa muda o paradigma de "computador que precisa ser consertado" para "computador que aprende com seus próprios erros".
Em vez de interromper a computação para consertar o hardware, o computador usa a própria computação para se auto-ajustar. Isso abre o caminho para algoritmos quânticos que rodam por dias ou semanas sem parar, essenciais para descobertas científicas complexas, como simular novas drogas ou materiais.

Resumo em uma frase:
Os cientistas ensinaram o computador quântico a se "auto-ajustar" em tempo real, usando os próprios erros como lição, permitindo que ele rode para sempre sem precisar parar para ser consertado por humanos.