Reinforcement Learning Control of Quantum Error Correction

Questo lavoro presenta un framework sperimentale su un processore superconduttore che integra l'apprendimento per rinforzo nella correzione degli errori quantistici, permettendo al sistema di adattarsi in tempo reale alle derive ambientali senza interrompere il calcolo e raggiungendo prestazioni record di stabilità logica.

Volodymyr Sivak, Alexis Morvan, Michael Broughton, Rodrigo G. Cortiñas, Johannes Bausch, Andrew W. Senior, Matthew Neeley, Alec Eickbusch, Noah Shutty, Laleh Aghababaie Beni, James S. Spencer, Francisco J. H Heras, Thomas Edlich, Dmitry Abanin, Amira Abbas, Rajeev Acharya, Georg Aigeldinger, Ross Alcaraz, Sayra Alcaraz, Trond I. Andersen, Markus Ansmann, Frank Arute, Kunal Arya, Walt Askew, Nikita Astrakhantsev, Juan Atalaya, Brian Ballard, Joseph C. Bardin, Hector Bates, Andreas Bengtsson, Majid Bigdeli Karimi, Alexander Bilmes, Simon Bilodeau, Felix Borjans, Alexandre Bourassa, Jenna Bovaird, Dylan Bowers, Leon Brill, Peter Brooks, David A. Browne, Brett Buchea, Bob B. Buckley, Tim Burger, Brian Burkett, Nicholas Bushnell, Jamal Busnaina, Anthony Cabrera, Juan Campero, Hung-Shen Chang, Silas Chen, Ben Chiaro, Liang-Ying Chih, Agnetta Y. Cleland, Bryan Cochrane, Matt Cockrell, Josh Cogan, Roberto Collins, Paul Conner, Harold Cook, William Courtney, Alexander L. Crook, Ben Curtin, Martin Damyanov, Sayan Das, Dripto M. Debroy, Sean Demura, Paul Donohoe, Ilya Drozdov, Andrew Dunsworth, Valerie Ehimhen, Aviv Moshe Elbag, Lior Ella, Mahmoud Elzouka, David Enriquez, Catherine Erickson, Vinicius S. Ferreira, Marcos Flores, Leslie Flores Burgos, Ebrahim Forati, Jeremiah Ford, Austin G. Fowler, Brooks Foxen, Masaya Fukami, Alan Wing Lun Fung, Lenny Fuste, Suhas Ganjam, Gonzalo Garcia, Christopher Garrick, Robert Gasca, Helge Gehring, Robert Geiger, Élie Genois, William Giang, Dar Gilboa, James E. Goeders, Edward C. Gonzales, Raja Gosula, Stijn J. de Graaf, Alejandro Grajales Dau, Dietrich Graumann, Joel Grebel, Alex Greene, Jonathan A. Gross, Jose Guerrero, Loïck Le Guevel, Tan Ha, Steve Habegger, Tanner Hadick, Ali Hadjikhani, Michael C. Hamilton, Matthew P. Harrigan, Sean D. Harrington, Jeanne Hartshorn, Stephen Heslin, Paula Heu, Oscar Higgott, Reno Hiltermann, Hsin-Yuan Huang, Mike Hucka, Christopher Hudspeth, Ashley Huff, William J. Huggins, Evan Jeffrey, Shaun Jevons, Zhang Jiang, Xiaoxuan Jin, Chaitali Joshi, Pavol Juhas, Andreas Kabel, Dvir Kafri, Hui Kang, Kiseo Kang, Amir H. Karamlou, Ryan Kaufman, Kostyantyn Kechedzhi, Tanuj Khattar, Mostafa Khezri, Seon Kim, Can M. Knaut, Bryce Kobrin, Fedor Kostritsa, John Mark Kreikebaum, Ryuho Kudo, Ben Kueffler, Arun Kumar, Vladislav D. Kurilovich, Vitali Kutsko, Nathan Lacroix, David Landhuis, Tiano Lange-Dei, Brandon W. Langley, Pavel Laptev, Kim-Ming Lau, Justin Ledford, Joy Lee, Kenny Lee, Brian J. Lester, Wendy Leung, Lily Li, Wing Yan Li, Ming Li, Alexander T. Lill, William P. Livingston, Matthew T. Lloyd, Aditya Locharla, Laura De Lorenzo, Daniel Lundahl, Aaron Lunt, Sid Madhuk, Aniket Maiti, Ashley Maloney, Salvatore Mandrà, Leigh S. Martin, Orion Martin, Eric Mascot, Paul Masih Das, Dmitri Maslov, Melvin Mathews, Cameron Maxfield, Jarrod R. McClean, Matt McEwen, Seneca Meeks, Kevin C. Miao, Zlatko K. Minev, Reza Molavi, Sebastian Molina, Shirin Montazeri, Charles Neill, Michael Newman, Anthony Nguyen, Murray Nguyen, Chia-Hung Ni, Murphy Yuezhen Niu, Logan Oas, Raymond Orosco, Kristoffer Ottosson, Alice Pagano, Agustin Di Paolo, Sherman Peek, David Peterson, Alex Pizzuto, Elias Portoles, Rebecca Potter, Orion Pritchard, Michael Qian, Chris Quintana, Arpit Ranadive, Matthew J. Reagor, Rachel Resnick, David M. Rhodes, Daniel Riley, Gabrielle Roberts, Roberto Rodriguez, Emma Ropes, Lucia B. De Rose, Eliott Rosenberg, Emma Rosenfeld, Dario Rosenstock, Elizabeth Rossi, Pedram Roushan, David A. Rower, Robert Salazar, Kannan Sankaragomathi, Murat Can Sarihan, Kevin J. Satzinger, Max Schaefer, Sebastian Schroeder, Henry F. Schurkus, Aria Shahingohar, Michael J. Shearn, Aaron Shorter, Vladimir Shvarts, Spencer Small, W. Clarke Smith, David A. Sobel, Barrett Spells, Sofia Springer, George Sterling, Jordan Suchard, Aaron Szasz, Alexander Sztein, Madeline Taylor, Jothi Priyanka Thiruraman, Douglas Thor, Dogan Timucin, Eifu Tomita, Alfredo Torres, M. Mert Torunbalci, Hao Tran, Abeer Vaishnav, Justin Vargas, Sergey Vdovichev, Guifre Vidal, Catherine Vollgraff Heidweiller, Meghan Voorhees, Steven Waltman, Jonathan Waltz, Shannon X. Wang, Brayden Ware, James D. Watson, Yonghua Wei, Travis Weidel, Theodore White, Kristi Wong, Bryan W. K. Woo, Christopher J. Wood, Maddy Woodson, Cheng Xing, Z. Jamie Yao, Ping Yeh, Bicheng Ying, Juhwan Yoo, Noureldin Yosri, Elliot Young, Grayson Young, Adam Zalcman, Ran Zhang, Yaxing Zhang, Ningfeng Zhu, Nicholas Zobrist, Zhenjie Zou, Ryan Babbush, Dave Bacon, Sergio Boixo, Yu Chen, Zijun Chen, Michel Devoret, Monica Hansen, Jeremy Hilton, Cody Jones, Julian Kelly, Alexander N. Korotkov, Erik Lucero, Anthony Megrant, Hartmut Neven, William D. Oliver, Ganesh Ramachandran, Vadim Smelyanskiy, Paul V. Klimov

Pubblicato Tue, 10 Ma
📖 4 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Immagina di avere un'orchestra di violini magici (i qubit) che devono suonare una sinfonia perfetta per giorni interi. Il problema è che questi violini sono estremamente delicati: il minimo cambiamento di temperatura, un piccolo spostamento dell'aria o un leggero invecchiamento del legno (il drift o "deriva" ambientale) fa sì che si scordino immediatamente. Se si scordano, la musica diventa rumore e l'informazione si perde.

Fino a oggi, la soluzione per i computer quantistici era come fermare l'orchestra ogni ora, far venire un accordatore umano, riassestare ogni singolo violino e poi ripartire. Ma se la sinfonia deve durare giorni o settimane, fermarsi continuamente è impossibile: non si finirebbe mai di accordare e non si suonerebbe mai davvero.

Cosa ha fatto Google con questo nuovo studio?
Hanno inventato un sistema in cui l'orchestra stessa impara ad accordarsi mentre suona, senza mai fermarsi. Lo hanno fatto usando un intelligenza artificiale (un agente di Reinforcement Learning, o apprendimento per rinforzo) che agisce come un "maestro d'orchestra super-intelligente".

Ecco come funziona, passo dopo passo, con delle analogie semplici:

1. Gli errori sono messaggi, non solo disastri

In un computer quantistico, quando qualcosa va storto, il sistema rileva un "errore". Tradizionalmente, questi errori vengono usati solo per correggere la nota sbagliata e basta.
In questo nuovo approccio, il computer dice: "Aspetta! Questo errore non è solo un problema da risolvere, è un messaggio!".
Ogni volta che il computer rileva un errore, lo usa come un segnale di feedback per l'Intelligenza Artificiale. È come se il violino, quando stona, non facesse solo un "bip" di allarme, ma dicesse al maestro: "Ehi, la corda del La è troppo tesa di un millimetro".

2. L'agente che impara dai suoi sbagli

L'Intelligenza Artificiale (l'agente RL) ascolta questi messaggi. Non ha una lista di istruzioni scritte da un umano su come accordare i violini. Invece, prova piccole modifiche ai controlli (come tirare leggermente una corda o cambiare la temperatura) e guarda cosa succede agli errori.

  • Se dopo una modifica ci sono meno errori, l'IA pensa: "Bravo! Ho fatto la cosa giusta, lo ricorderò".
  • Se ci sono più errori, pensa: "Ops, ho sbagliato, non lo farò più".

Questo processo è continuo. L'IA aggiorna i controlli del computer quantistico in tempo reale, mentre il calcolo sta avvenendo.

3. Il risultato: Un computer che non si ferma mai

Grazie a questo sistema, il computer quantistico è riuscito a:

  • Stabilizzarsi da solo: Ha resistito a "derivate" artificiali (come se qualcuno avesse spostato i violini di posto) mantenendo la musica perfetta.
  • Migliorare la qualità: Anche partendo da un sistema già ben accordato dagli umani, l'IA è riuscita a perfezionarlo ulteriormente, riducendo gli errori del 20% in più.
  • Scalare: Hanno simulato che questo metodo funzionerebbe anche con computer quantistici molto più grandi (con migliaia di qubit), perché l'IA impara a gestire la complessità senza impazzire.

L'analogia finale: Il ciclista e il vento

Immagina di essere un ciclista che deve pedalare per 1000 km contro il vento.

  • Il vecchio metodo: Ogni 10 km ti fermi, misuri la direzione del vento, aggiusti il tuo caschetto e riparti. Se il vento cambia spesso, passi più tempo a fermarti che a pedalare.
  • Il nuovo metodo (Google): Indossi un casco intelligente che sente il vento cambiare ogni secondo. Il casco muove automaticamente le tue ali (o la tua posizione) per compensare il vento istantaneamente. Non ti fermi mai, e arrivi alla meta più velocemente e con meno fatica.

In sintesi:
Questo lavoro segna un cambiamento di paradigma. Non dobbiamo più costruire computer quantistici "perfetti" che non si rompono mai (cosa impossibile). Invece, costruiamo computer che imparano dai loro errori e si correggono da soli in tempo reale, rendendo possibile l'era dei computer quantistici che lavorano per giorni o anni senza interruzioni. È un passo fondamentale verso computer quantistici che possono davvero risolvere problemi complessi, come la scoperta di nuovi farmaci o materiali.