Graph Reinforcement Learning for Calibration-Aware Quantum Circuit Routing

Dit artikel presenteert een kalibratiebewuste grafen-reinforcement learning-aanpak voor quantumcircuit-routing die, door gebruik te maken van realtime hardware-kalibratiedata en proximal policy optimization, een aanzienlijk hogere gesimuleerde fidelity bereikt dan standaard SABRE-gebaseerde methoden op kleine tot middelgrote circuits, ondanks het feit dat het hogere aantallen twee-qubit-poorten met zich meebrengt.

Oorspronkelijke auteurs: Yash Vardhan Tomar, Dheeraj Peddireddy, Vaneet Aggarwal

Gepubliceerd 2026-06-12
📖 4 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Yash Vardhan Tomar, Dheeraj Peddireddy, Vaneet Aggarwal

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je voor dat je een team van bezorgers (de quantumdata) probeert te begeleiden door een enorme, chaotische stad (de quantumcomputer) om pakketjes af te leveren (berekeningen uit te voeren).

In het verleden gaven navigatie-apps voor deze quantumsteden alleen om één ding: afstand. Ze zeiden tegen de bezorgers: "Neem de kortste route, zelfs als dat betekent dat je over een brug met gaten rijdt of door een bouwzone gaat." De logica was simpel: minder kilometers rijden betekent minder slijtage.

Dit artikel betoogt echter dat in de echte wereld van quantumcomputers afstand niet alles is. Soms is een iets langere route die kapotte bruggen vermijdt, veel beter, omdat het pakketje in een veel betere staat op de bestemming aankomt.

Hier is een overzicht van wat de onderzoekers hebben gedaan, met behulp van eenvoudige analogieën:

Het Probleem: De "Perfecte" Route versus de "Echte" Route

Quantumcomputers zijn als steden waar de kwaliteit van de wegen (verbindingen tussen onderdelen van de computer) constant verandert. Sommige wegen zijn glad en snel; andere zijn hobbelig en gevoelig voor defecten. Deze kwaliteit wordt "kalibratie" genoemd.

Oude navigatiesystemen (zoals het genoemde standaard SABRE-algoritme) zijn als GPS-apps die alleen naar een kaart kijken. Ze zeggen: "Ga deze kant op, want het is 5 mijl." Ze weten niet dat de weg van 5 mijl momenteel overstroomd is, terwijl de weg van 6 mijl droog is.

De Oplossing: Een "Kalibratie-bewuste" GPS

De auteurs hebben een nieuw, slimmer navigatiesysteem gemaakt met behruik van Graph Reinforcement Learning. Denk aan dit als een GPS die niet alleen naar de kaart kijkt, maar ook het live verkeersbericht en de weersverwachting voor elke weg controleert voordat er een beslissing wordt genomen.

  • Het "Brein": Ze hebben een AI getraind (met een methode genaamd Proximal Policy Optimization) om de navigator te zijn.
  • De Input: Voordat de AI de bezorgers vertelt waar ze heen moeten, kijkt de AI naar:
    1. De resterende afleverlijst (het circuit).
    2. Waar de bezorgers momenteel geparkeerd staan (de plaatsing).
    3. Het live gezondheidsrapport van elke weg (de kalibratiedata van de IBM Heron r2 chip).
  • De Strategie: De AI is bereid om een iets langere route te nemen (extra "SWAP"-operaties toevoegen, wat vergelijkbaar is met omwegen) als dat betekent dat een weg die bekend staat als defect of luidruchtig wordt vermeden.

Het Experiment: Een Race tegen de Oude Methode

De onderzoekers testten hun nieuwe AI-navigator tegen twee gevestigde "ouderwetse" GPS-systemen:

  1. SABRE-best20: De standaard, op afstand gerichte navigator.
  2. Target-aware SABRE: Een iets slimmere versie die de kaart kent, maar live verkeersgegevens niet zo effectief gebruikt.

Ze testten de routes op negen verschillende "afleverroutes" (quantumcircuits) van variërende grootte (5, 8 en 10 stops) met behulp van realtime data van IBM's quantumhardware.

De Resultaten: Kwaliteit boven Kwantiteit

De resultaten waren een duidelijke overwinning voor de nieuwe AI, maar met een nuance:

  • De Grote Winst: Op kleinere en middelgrote routes (5 en 8 stops) waren de routes van de AI veel succesvoller. De "pakketjes" arriveerden in een veel betere staat.
    • De Score: De AI behaalde een "fidelity" (succespercentage) van 0,727, terwijl de oude methoden rond de 0,440 en 0,481 scoorden. Dat is een enorme sprong in kwaliteit.
  • De Afweging: Om deze hoge kwaliteit te krijgen, nam de AI ook meer stappen. Het voegde ongeveer 8 extra omwegen (two-qubit gates) toe en maakte de route iets dieper.
    • De Les: Een paar extra stappen zetten om een kapotte brug te vermijden, is het waard als het de lading redt.
  • De Beperking: Op de grootste routes (10 stops) deed de AI het minder goed. Waarom? Omdat de "stadsplattegrond" die ze kregen een rigide boomstructuur had met zeer weinig alternatieve paden. Wanneer er geen goede omwegen beschikbaar zijn, kon de AI de ouderwetse afstandgerichte GPS niet te slim af zijn.

De Kern van het Verhaal

Dit artikel bewijst dat voor quantumcomputers weten wat de huidige staat van de hardware is, belangrijker is dan alleen het tellen van het aantal stappen.

Door een AI te leren om naar het "live verkeer" (kalibratiedata) te kijken en routes te kiezen die "kapotte bruggen" (luidruchtige koppelstukken) vermijden, zelfs als die routes iets langer zijn, kunnen we veel betere resultaten behalen. Het is een verschuiving van de vraag "Wat is de kortste route?" naar de vraag "Wat is de veiligste route?".

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →