TuniQ: Autotuning Compilation Passes for Quantum Workloads at Scale for Effectiveness and Efficiency

TuniQ ist ein auf Reinforcement Learning basierendes System, das basierend auf spezifischen Hardware- und Rauschbedingungen dynamisch optimale Kompilierungspässe für Quantenschaltkreise auswählt und damit die Ausgabe-Genauigkeit sowie die Kompilierungseffizienz im Vergleich zu fortschrittlichen statischen Kompilatoren wie dem Qiskit-Transpiler von IBM erheblich verbessert.

Ursprüngliche Autoren: Mohammad Abrarul Hasanat, Jason Ludmir, Tirthak Patel, Rohan Basu Roy

Veröffentlicht 2026-05-13
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Mohammad Abrarul Hasanat, Jason Ludmir, Tirthak Patel, Rohan Basu Roy

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Stellen Sie sich vor, Sie versuchen, eine empfindliche, komplexe Nachricht über eine sehr laute, holprige Straße zu senden. Die Nachricht ist ein Quantenprogramm (eine Reihe von Anweisungen für einen Quantencomputer), und die Straße ist die Quantenhardware.

Das Problem ist, dass die Straße voller Schlaglöcher (Fehler) ist und die Nachricht mit der Zeit, die sie unterwegs ist, an Qualität verliert. Wenn Sie einen langen, verschlungenen Weg wählen, könnte Ihre Nachricht verzerrt ankommen. Wenn Sie einen schnellen Weg wählen, aber zu viele Schlaglöcher treffen, kommt sie ebenfalls verzerrt an.

Derzeit verwenden die „Fahrer" (die Compiler), die diese Nachrichten senden, ein festes Regelwerk. Sie weisen jeder einzelnen Nachricht an, exakt denselben Weg zu nehmen, unabhängig davon, ob die Nachricht einfach oder komplex ist oder ob die Straße derzeit trocken oder schlammig ist. Manchmal funktioniert dies, aber oft ist es ineffizient und führt zu einer langsamen Zustellung oder einer beschädigten Nachricht.

TuniQ ist ein neuer, intelligenter Fahrer, der die Regeln ändert. Anstatt einer festen Karte zu folgen, verwendet es Reinforcement Learning (eine Art von KI, die durch Versuch und Irrtum lernt), um in Echtzeit die beste Route für jede einzelne Nachricht zu entscheiden.

So funktioniert TuniQ, aufgeteilt in einfache Konzepte:

1. Das „feste Regelwerk" vs. der „intelligente Fahrer"

Stellen Sie sich das aktuelle System (IBM Qiskit) wie ein Navi vor, das jedes Auto zwingt, dieselbe Autobahn zu nehmen, selbst wenn für ein bestimmtes Auto eine Abkürzung existiert. Es wendet denselben Satz von „Optimierungspassagen" (Verkehrsregeln) auf jede Quantenschaltung an.

  • Der Fehler: Eine Abkürzung, die Zeit für ein kleines Auto spart, könnte für einen großen LKW einen Stau verursachen. Ebenso kann eine Compiler-Einstellung, die einem Quantenprogramm hilft, ein anderes tatsächlich schädigen.
  • Die TuniQ-Lösung: TuniQ ist wie ein Fahrer, der die spezifische Fracht (die Schaltung) betrachtet, das aktuelle Wetter und die Straßenverhältnisse (die Rauschpegel der Hardware) prüft und dann entscheidet: „Muss ich die malerische Route nehmen, um ein Schlagloch zu vermeiden? Oder sollte ich Gas geben, weil die Straße frei ist?" Es wählt aus, welche „Verkehrsregeln" für diese spezifische Fahrt angewendet und welche übersprungen werden sollen.

2. Der „Dual-Encoder" (Die zwei Augenpaare des Fahrers)

Um diese Entscheidungen zu treffen, muss TuniQ die Welt in verschiedenen Phasen der Fahrt unterschiedlich sehen. Die Arbeit beschreibt ein Dual-Encoder-System:

  • Vor der Straße (Logische Sicht): Am Anfang betrachtet der Fahrer den Plan der Fahrt. Er sieht die logischen Verbindungen zwischen den Passagieren (Qubits), ohne sich noch um die spezifischen Schlaglöcher zu kümmern. Er fragt: „Wie müssen diese Personen zusammensitzen?"
  • Auf der Straße (Physikalische Sicht): Sobald das Auto auf der Straße ist, schaltet der Fahrer auf ein anderes Augenpaar um. Jetzt betrachtet er das tatsächliche Auto und die tatsächlichen Straßenverhältnisse. Er sieht, welche spezifischen Reifen (physikalische Qubits) sich abnutzen und welche Teile der Straße holprig sind.
  • Warum das wichtig ist: Dies ermöglicht TuniQ, sich anzupassen. Wenn die Straße schlammiger wird (das Rauschen zunimmt), kann es sofort auf eine sicherere, langsamere Route wechseln, ohne neu trainiert werden zu müssen.

3. Die „geformten Belohnungen" (Lernen aus der Reise)

Auf die alte Weise erhielt der Fahrer erst am Ende Feedback: „Haben Sie die Nachricht zugestellt?" Wenn die Nachricht beschädigt war, wusste der Fahrer nicht, welche Kurve das Problem verursacht hatte.

  • Der Ansatz von TuniQ: TuniQ erhält unterwegs kleine „Punkte" (Belohnungen).
    • „Gut gemacht, dass du dieses Schlagloch vermieden hast!" (Zwischenbelohnung).
    • „Toll gemacht, dass du das Auto stabil gehalten hast!" (Eine weitere Zwischenbelohnung).
    • „Du hast die Nachricht perfekt zugestellt!" (Endbelohnung).
      Dies hilft dem Fahrer zu lernen, dass eine bestimmte Kurve zu Beginn der Fahrt entscheidend für den Erfolg der gesamten Reise war, auch wenn das Ergebnis erst am Ende sichtbar wurde.

4. Die „dynamische Maske" (Der Sicherheitswächter)

Man kann einem Fahrer nicht einfach erlauben, jede Straße zu wählen; einige Straßen sind Sackgassen oder illegal.

  • TuniQ verwendet Dynamic Action Masking (dynamische Aktionsmaskierung). Stellen Sie sich dies als Leitplanke vor, die den Fahrer sofort daran hindert, eine Kurve zu nehmen, die das Auto beschädigen oder gegen Verkehrsregeln verstoßen würde. Es stellt sicher, dass das Endergebnis unabhängig davon, was die KI entscheidet, immer ein gültiger, befahrbarer Pfad ist.

Die Ergebnisse: Schneller und klarer

Die Arbeit testete TuniQ auf echten Quantencomputern von IBM. Hier ist, was passierte:

  • Bessere Qualität: Die Nachrichten kamen viel klarer an. Im Durchschnitt verbesserte sich die „Fidelität" (wie stark die Nachricht dem ursprünglichen Plan entsprach) um 20 %.
  • Schnellere Zustellung: Die Zeit, die für die Routenplanung (Kompilierungszeit) benötigt wurde, sank um 34 %. Das ist enorm, da viele Quantenalgorithmen ihre Route Tausende von Malen hintereinander planen müssen.
  • Kein Neulernen erforderlich: Wenn Sie den Fahrer in eine andere Stadt versetzen (einen anderen Quantencomputer), funktioniert TuniQ sofort, ohne dass er die neue Stadt von Grund auf neu lernen muss.
  • Skalierbarkeit: Je größer und komplexer die Nachrichten werden (Utility-Scale-Schaltungen), desto besser wird TuniQ im Vergleich zu den alten festen Regelwerken.

Zusammenfassung

TuniQ ist wie der Upgrade von einem starren, „one-size-fits-all"-Navi zu einem intelligenten, adaptiven Co-Piloten. Es betrachtet die spezifische Fracht, prüft die Echtzeit-Straßenverhältnisse und lernt aus jeder Fahrt, um die perfekte Mischung aus Geschwindigkeit und Sicherheit zu wählen. Dies macht Quantencomputing zuverlässiger und schneller, besonders wenn wir versuchen, in Zukunft größere Probleme zu lösen.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →