Towards Real-time Control of a CartPole System on a Quantum Computer

Dit artikel presenteert een end-to-end onderzoek naar een minimaal hybride quantum-klassiek agent die een CartPole-systeem bestuurt op een fysieke supergeleidende quantumprocessor, waarbij wordt aangetoond dat een model met één qubit klassieke tegenhangers overtreft, terwijl kritieke afwegingen tussen shot-begrotingen en besturingsfrequenties worden geïdentificeerd en lage-latentie feedback wordt bereikt door de uitlezelektronica direct te programmeren.

Oorspronkelijke auteurs: Nguyen Truong Thu Ngo, Väinö Mehtola, Jérome Lenssen, Peiyong Wang, Francesco Cosco, Tien-Fu Lu, James Q. Quach

Gepubliceerd 2026-05-05
📖 5 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: Nguyen Truong Thu Ngo, Väinö Mehtola, Jérome Lenssen, Peiyong Wang, Francesco Cosco, Tien-Fu Lu, James Q. Quach

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je voor dat je een robot probeert te leren een bezemsteel op zijn hand in evenwicht te houden. Dit is een klassieke uitdaging in de robotica die "CartPole" wordt genoemd. Normaal gesproken leren we robots met klassieke computers (het type dat in je laptop zit). Maar wat als we het proberen met een quantumcomputer?

Dit artikel is een rapportkaart van dat experiment. De onderzoekers stelden drie grote vragen:

  1. Kan een kleine quantumcomputer leren de bezemsteel sneller in evenwicht te houden dan een normale computer?
  2. Raakt de robot in de war als we hem trainen op de ene snelheid, maar vragen hem om op een andere snelheid te werken?
  3. Kunnen we de quantumcomputer snel genoeg maken om de robot in real-time daadwerkelijk te besturen, of is hij te traag?

Hier is de uiteenzetting van hun bevindingen, met eenvoudige analogieën.

1. Het "Kleine Brein" versus het "Grote Brein"

De Opzet:
De onderzoekers bouwden een "hybride" robotbrein. Het bestaat grotendeels uit een normale computer, maar heeft één klein quantumgedeelte (een enkele "qubit", die lijkt op een quantummunt die kop, munt of beide tegelijk kan zijn). Ze vergeleken dit met een "groot brein" dat volledig bestaat uit standaard computeronderdelen (een diep neurale netwerk).

Het Resultaat:
Het kleine quantumbrein was een snelheidsduivel.

  • De Analogie: Stel je twee studenten voor die een toets maken. De student met het "Grote Brein" moet het leerboek 430 keer lezen voordat hij een 10 haalt. De student met het "Kleine Quantumbrein" hoeft het slechts 160 keer te lezen om dezelfde 10 te halen.
  • De Haken en Ogen: Deze snelheidswinst vond plaats, zelfs toen het quantumbrein zijn antwoorden moest raden door de munt veel keer op te gooien (een methode genaamd "parameter-shift") in plaats van het antwoord perfect te weten. Het bewees dat zelfs een zeer klein quantummodel verrassend efficiënt kan zijn in het leren.

2. Het "Snelheidsdrempel"-Probleem (Trainen versus Besturen)

De Opzet:
In de echte wereld moet een robot zeer snel beslissingen nemen (zoals 50 keer per seconde). Quantumcomputers zijn echter luidruchtig en traag. Om een duidelijk antwoord van de quantummunt te krijgen, moet je deze vaak opgooien (zogenaamde "shots").

  • De Afweging: Gooi je de munt te weinig keer op, dan is het antwoord luidruchtig (alsof je probeert een fluistering te horen in een storm). Gooi je hem te vaak op, dan duurt het te lang en valt de robot om voordat hij kan reageren.

Het Experiment:
De onderzoekers trainden de robot op verschillende snelheden en testten hem vervolgens op verschillende snelheden om te zien of hij in de war zou raken. Ze maakten een enorme "warmtekaart" (zoals een weerkaart) die liet zien hoe goed de robot in evenwicht bleef onder verschillende omstandigheden.

Het Resultaat:

  • De "Inferentie"-snelheid is het belangrijkst: Het maakte niet uit hoe snel de robot was getraind. Wat telde, was hoe snel hij reed (inferentie). Als de robot snel beslissingen mocht nemen (hoge frequentie), bleef hij goed in evenwicht. Als hij gedwongen werd langzaam te rijden, viel hij om.
  • Meer Gooien = Meer Stabiliteit: Als de robot langzaam moest rijden, konden ze dit oplossen door hem meer "shots" te geven (de munt vaker opgooien om een duidelijk antwoord te krijgen).
  • Het Sweet Spot: Je moet een balans vinden. Je wilt dat de robot snel rijdt én genoeg tijd heeft om een duidelijk quantumantwoord te krijgen. Het artikel biedt een kaart om ingenieurs te helpen deze perfecte balans te vinden voor toekomstige robots.

3. De "Verkeersopstopping" versus de "Autosnelweg" (Latentie)

De Opzet:
Dit is het meest kritieke deel. Zelfs als de quantumcomputer goed leert, is het nutteloos als hij te traag is om in real-time te reageren.

  • Het Probleem: Normaal gesproken, wanneer je een quantumcomputer in de cloud gebruikt, moet je je verzoek door veel "bureaucratie" sturen (softwarelagen, compilers, internetvertragingen). Het is alsof je probeert een raceauto door een stad te rijden met stopborden, verkeerslichten en bouwvakken.
  • De Oude Manier: Met de standaardsoftware kon de robot slechts ongeveer 0,14 keer per seconde een beslissing nemen. Hij was in feite in slaap.

De Doorbraak:
De onderzoekers besloten de "bureaucratie" te omzeilen. Ze programmeerden de hardware van de quantumcomputer direct, alsof een racecoureur een afkorting neemt via een privé-autosnelweg.

  • Het Resultaat: Door de tussenpersonen uit te schakelen, versnelden ze de robot met 40 keer. De robot kon nu 6,2 keer per seconde beslissingen nemen.
  • De Limiet: Hoewel 6,2 keer per seconde een enorme verbetering is, is het nog steeds niet snel genoeg voor een bezemsteel die 50 keer per seconde in evenwicht moet worden gehouden. Het bewijst echter dat de "verkeersopstopping" het hoofdprobleem was, niet de quantumfysica zelf.

De Conclusie

Dit artikel is een "proof of concept" dat zegt:

  1. Ja, een klein quantumbrein kan een balancerende taak sneller leren dan een groot klassiek brein.
  2. Ja, we kunnen precies in kaart brengen hoe snel en hoe precies de quantumcomputer moet zijn om te voorkomen dat de robot omvalt.
  3. Ja, we kunnen quantumcomputers snel genoeg maken om bruikbaar te zijn voor besturing, maar alleen als we stoppen met het gebruik van de trage, standaardsoftware en direct met de hardware praten.

De onderzoekers hebben nog geen zelfrijdende auto of medische robot gebouwd. Ze hebben alleen bewezen dat de motor (het quantumleren) werkt, en ze hebben uitgezocht hoe ze de verkeersopstoppingen (latentie) kunnen verwijderen zodat het uiteindelijk sneller kan rijden.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →