Towards Real-time Control of a CartPole System on a Quantum Computer

Dieser Artikel präsentiert eine End-to-End-Untersuchung eines minimalen hybriden Quanten-Klassischen-Agenten, der ein CartPole-System auf einem physikalischen supraleitenden Quantenprozessor steuert, und zeigt, dass ein Ein-Qubit-Modell klassische Gegenstücke übertrifft, während kritische Zielkonflikte zwischen Schussbudgets und Steuerraten identifiziert werden und eine Latenzzeit-arme Rückkopplung durch die direkte Programmierung der Ausleseelektronik erreicht wird.

Ursprüngliche Autoren: Nguyen Truong Thu Ngo, Väinö Mehtola, Jérome Lenssen, Peiyong Wang, Francesco Cosco, Tien-Fu Lu, James Q. Quach

Veröffentlicht 2026-05-05
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Nguyen Truong Thu Ngo, Väinö Mehtola, Jérome Lenssen, Peiyong Wang, Francesco Cosco, Tien-Fu Lu, James Q. Quach

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Stellen Sie sich vor, Sie versuchen, einem Roboter beizubringen, einen Besenstiel auf seiner Hand im Gleichgewicht zu halten. Dies ist eine klassische Herausforderung in der Robotik, die als „CartPole" bekannt ist. Normalerweise bringen wir Robotern bei, dies mit klassischen Computern zu tun (der Art, wie sie in Ihrem Laptop zu finden sind). Aber was wäre, wenn wir versuchen würden, es mit einem Quantencomputer zu lehren?

Dieser Artikel ist ein Zeugnis für dieses Experiment. Die Forscher stellten drei große Fragen:

  1. Kann ein winziger Quantencomputer lernen, den Besenstiel schneller im Gleichgewicht zu halten als ein normaler Computer?
  2. Wird der Roboter verwirrt, wenn wir ihn mit einer Geschwindigkeit trainieren, aber ihn bei einer anderen Geschwindigkeit arbeiten lassen?
  3. Können wir den Quantencomputer schnell genug machen, um den Roboter tatsächlich in Echtzeit zu steuern, oder ist er zu langsam?

Hier ist eine Aufschlüsselung ihrer Erkenntnisse, unter Verwendung einfacher Analogien.

1. Das „winzige Gehirn" vs. das „große Gehirn"

Der Aufbau:
Die Forscher bauten ein „hybrides" Roboterhirn. Es besteht größtenteils aus einem normalen Computer, hat aber einen winzigen Quantenteil (ein einzelnes „Qubit", das wie eine Quantenmünze ist, die Kopf, Zahl oder beides gleichzeitig sein kann). Sie verglichen dies mit einem „großen Gehirn", das vollständig aus Standard-Computerkomponenten besteht (ein tiefes neuronales Netz).

Das Ergebnis:
Das winzige Quantengehirn war ein Geschwindigkeitsdämon.

  • Die Analogie: Stellen Sie sich zwei Schüler vor, die eine Prüfung ablegen. Der Schüler des „Großen Gehirns" muss das Lehrbuch 430 Mal lesen, bevor er eine Eins bekommt. Der Schüler des „winzigen Quantengehirns" muss es nur 160 Mal lesen, um dieselbe Eins zu erhalten.
  • Der Haken: Dieser Geschwindigkeitsschub trat sogar dann auf, wenn das Quantengehirn seine Antworten erraten musste, indem es die Münze viele Male warf (eine Methode namens „Parameter-Verschiebung"), anstatt die Antwort perfekt zu kennen. Es bewies, dass selbst ein sehr kleines Quantenmodell beim Lernen überraschend effizient sein kann.

2. Das Problem des „Geschwindigkeitsbremsers" (Training vs. Fahren)

Der Aufbau:
In der realen Welt muss ein Roboter sehr schnell Entscheidungen treffen (zum Beispiel 50 Mal pro Sekunde). Quantencomputer sind jedoch verrauscht und langsam. Um eine klare Antwort von der Quantenmünze zu erhalten, muss man sie oft viele Male werfen (sogenannte „Shots").

  • Der Kompromiss: Wenn Sie die Münze zu selten werfen, ist die Antwort verrauscht (wie wenn man versucht, ein Flüstern in einem Sturm zu hören). Wenn Sie sie zu oft werfen, dauert es zu lange, und der Roboter fällt um, bevor er reagieren kann.

Das Experiment:
Die Forscher trainierten den Roboter mit unterschiedlichen Geschwindigkeiten und testeten ihn dann bei unterschiedlichen Geschwindigkeiten, um zu sehen, ob er verwirrt würde. Sie erstellten eine große „Wärmekarte" (wie eine Wetterkarte), die zeigt, wie gut der Roboter unter verschiedenen Bedingungen das Gleichgewicht hielt.

Das Ergebnis:

  • Die „Inferenz"-Geschwindigkeit ist am wichtigsten: Es spielte keine Rolle, wie schnell der Roboter trainiert wurde. Wichtig war, wie schnell er fuhr (Inferenz). Wenn der Roboter schnell Entscheidungen treffen durfte (hohe Frequenz), hielt er das Gleichgewicht gut. Wenn er gezwungen wurde, langsam zu fahren, fiel er um.
  • Mehr Würfe = mehr Stabilität: Wenn der Roboter langsam fahren musste, konnten sie es beheben, indem sie ihm mehr „Shots" gaben (die Münze öfter warfen, um eine klare Antwort zu erhalten).
  • Der Sweet Spot: Man muss ein Gleichgewicht finden. Der Roboter muss schnell fahren und genug Zeit haben, um eine klare Quantenantwort zu erhalten. Der Artikel liefert eine Karte, die Ingenieuren hilft, dieses perfekte Gleichgewicht für zukünftige Roboter zu finden.

3. Der „Stau" vs. die „Autobahn" (Latenz)

Der Aufbau:
Dies ist der kritischste Teil. Selbst wenn der Quantencomputer gut lernt, ist er nutzlos, wenn er zu langsam ist, um in Echtzeit zu reagieren.

  • Das Problem: Normalerweise, wenn man einen Quantencomputer in der Cloud nutzt, muss man seine Anfrage durch viel „Bürokratie" senden (Softwareschichten, Compiler, Internetverzögerungen). Es ist, als würde man versuchen, ein Rennauto durch eine Stadt mit Stoppschildern, Ampeln und Baustellen zu fahren.
  • Der alte Weg: Mit der Standardsoftware konnte der Roboter nur etwa 0,14 Mal pro Sekunde eine Entscheidung treffen. Er war im Wesentlichen eingeschlafen.

Der Durchbruch:
Die Forscher beschlossen, die „Bürokratie" zu umgehen. Sie programmierten die Hardware des Quantencomputers direkt, wie ein Rennfahrer, der eine Abkürzung über eine private Autobahn nimmt.

  • Das Ergebnis: Durch das Streichen der Mittelsmänner beschleunigten sie den Roboter um den Faktor 40. Der Roboter konnte nun 6,2 Mal pro Sekunde Entscheidungen treffen.
  • Die Grenze: Obwohl 6,2 Mal pro Sekunde eine enorme Verbesserung ist, ist es immer noch nicht schnell genug für einen Besenstiel, der 50 Mal pro Sekunde im Gleichgewicht gehalten werden muss. Es beweist jedoch, dass der „Stau" das Hauptproblem war, nicht die Quantenphysik selbst.

Das Fazit

Dieser Artikel ist ein „Proof of Concept", der besagt:

  1. Ja, ein winziges Quantengehirn kann eine Balancieraufgabe schneller lernen als ein großes klassisches Gehirn.
  2. Ja, wir können genau kartieren, wie schnell und wie präzise der Quantencomputer sein muss, um zu verhindern, dass der Roboter umfällt.
  3. Ja, wir können Quantencomputer schnell genug machen, um für die Steuerung nützlich zu sein, aber nur wenn wir aufhören, die langsame Standardsoftware zu verwenden und direkt mit der Hardware sprechen.

Die Forscher haben noch kein autonomes Fahrzeug oder einen medizinischen Roboter gebaut. Sie haben lediglich bewiesen, dass der Motor (das Quantenlernen) funktioniert, und sie haben herausgefunden, wie man die Staus (Latenz) beseitigt, damit er schließlich schneller fahren kann.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →