QSpark: Towards Reliable Qiskit Code Generation

Het onderzoek presenteert QSpark, een gefinetuned Qwen2.5-Coder-32B-model dat met behulp van GRPO en ORPO aanzienlijk betere resultaten behaalt dan bestaande modellen bij het genereren van foutbestendige Qiskit-code, hoewel er nog uitdagingen blijven bij geavanceerde taken.

Kiana Kheiri, Aamna Aamir, Andriy Miranskyy, Chen Ding

Gepubliceerd 2026-03-11
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

QSpark: Een slimme assistent voor kwantumcode

Stel je voor dat je een heel complexe machine wilt bouwen, zoals een tijdreismachine of een supercomputer die alles tegelijk kan berekenen. Dat is wat kwantumcomputers doen. Maar er is een groot probleem: ze zijn zo raar en onvoorspelbaar dat zelfs de slimste programmeurs er vaak de bal van missen. Ze moeten rekening houden met vreemde regels uit de natuurkunde (zoals dat je een deeltje niet kunt kopiëren zonder het te veranderen), en als je één klein foutje maakt, werkt de hele machine niet meer.

Vroeger moesten mensen deze code handmatig schrijven, wat als het bouwen van een kathedraal met een lepeltje voelt: langzaam en foutgevoelig. Nu komen er AI's (kunstmatige intelligentie) die kunnen helpen, maar de meeste AI's die we nu hebben, zijn getraind op "normale" computercode. Ze zijn alsof je een meesterkok vraagt om een quantumrecept te schrijven, terwijl hij alleen maar pizza's heeft gemaakt. Hij probeert het wel, maar de pizza met kwantum-kruiden smaakt vaak niet goed.

Wat is QSpark?
De auteurs van dit paper hebben een nieuwe AI-assistent bedacht, genaamd QSpark. Het is als een slimme leermeester die specifiek is getraind op het schrijven van code voor kwantumcomputers (met behulp van een tool genaamd Qiskit).

Hoe hebben ze dit gedaan? Ze hebben niet zomaar een AI opgeleid. Ze hebben twee speciale technieken gebruikt om de AI te "leren" wat goed en fout is:

  1. De "Oordeel-techniek" (ORPO):
    Stel je voor dat je een schrijver hebt die een verhaal schrijft. Je geeft hem twee versies van hetzelfde verhaal: één is perfect, de andere zit vol fouten. Je zegt dan: "Deze versie is beter." De AI leert door te kijken naar het verschil tussen de goede en de slechte versie. Zo leert hij niet alleen wat er moet staan, maar ook hoe het eruit moet zien (netjes, leesbaar en volgens de regels). Dit is ORPO.

  2. De "Wedstrijd-techniek" (GRPO):
    Nu stel je je voor dat je de AI laat schrijftien verschillende versies van hetzelfde verhaal tegelijk. Dan kijkt je AI-systeem: "Welke van deze tien is het beste?" De winnende versie krijgt een puntje, de slechte versies krijgen een tik op de vingers. De AI leert hierdoor om steeds betere versies te produceren door te vergelijken met zijn eigen andere pogingen. Dit is GRPO.

Wat is het resultaat?
De onderzoekers hebben deze AI getest met een soort "examen" voor kwantumcode (de Qiskit HumanEval).

  • De oude AI's (die niet speciaal voor kwantum waren getraind) haalden vaak een onvoldoende.
  • De nieuwe QSpark-AI's haalden veel hogere cijfers. De versie met de "Oordeel-techniek" (ORPO) haalde zelfs een 56% slaagkans, wat een enorme sprong is ten opzichte van de concurrentie.

Maar is het perfect?
Nee, en dat is eerlijk. Het examen had drie moeilijkheidsgraden:

  • Basis: Simpele taken (zoals een lichtje aan- en uitzetten). Hier deed QSpark het fantastisch.
  • Gemiddeld: Iets complexere taken. Ook hier was QSpark de beste.
  • Zwaar: De allerlastigste taken (zoals het bouwen van een hele nieuwe quantum-machine). Hier faalden alle AI's, ook QSpark. Het was alsof ze probeerden een raket te bouwen terwijl ze nog niet eens wisten hoe je een fiets vasthoudt. Dit toont aan dat er nog veel werk te doen is.

Waarom is dit belangrijk?
Dit onderzoek laat zien dat we AI kunnen gebruiken om de drempel voor kwantumcomputers te verlagen. Het is alsof we een tolk hebben die de vreemde taal van de kwantumwereld vertaalt naar iets wat mensen begrijpen.

De grote les:
AI kan ons helpen om sneller en slimmer te werken, maar we moeten nog steeds de "meesters" blijven. De AI kan de basis leggen en de moeilijke puzzels oplossen, maar voor de allercomplexeste uitdagingen hebben we nog steeds menselijke genialiteit en geduld nodig. De onderzoekers roepen ook op tot betere "examens" en standaardregels, zodat iedereen in de wereld weet hoe goed een AI echt is, zodat we niet blijven gokken met kwantumcode.

Kortom: QSpark is een grote stap voorwaarts, een slimme assistent die ons dichter bij de toekomst brengt, maar die nog niet helemaal klaar is om de hele wereld te veroveren.