Diffusion Language Models Know the Answer Before Decoding

Deze paper introduceert Prophet, een trainingsvrije methode die de inferentie van diffusie-taalmodellen versnelt door dynamisch te beslissen wanneer het juiste antwoord al is geconvergeerd en de resterende tokens in één stap te decoderen, waardoor het aantal stappen tot 3,4 keer wordt verminderd zonder kwaliteitsverlies.

Pengxiang Li, Yefan Zhou, Dilxat Muhtar, Lu Yin, Shilin Yan, Li Shen, Soroush Vosoughi, Shiwei Liu

Gepubliceerd 2026-04-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Kernboodschap: De antwoorden zijn er al, we hoeven ze maar te "ontdekken"

Stel je voor dat je een Diffusion Language Model (DLM) hebt. Dit is een slimme AI die teksten schrijft, maar op een heel andere manier dan de gewone chatbots die we kennen (zoals de standaardversies van ChatGPT).

  • De gewone manier (Autoregressief): Dit is alsof je een zin letter voor letter schrijft. Je begint met "De", dan "hond", dan "loopt"... Je moet wachten tot het laatste woord er is voordat je de hele zin hebt.
  • De Diffusion-methode: Dit is alsof je een tekening maakt die eerst volledig wazig is (als een vlekkenpatroon) en die je stap voor stap scherper maakt. De AI begint met een "ruis" van woorden en probeert in elke ronde de onduidelijke plekken op te helderen tot de zin perfect is.

Het probleem: Deze "scherp maken"-methode is vaak traag. De AI moet veel rondjes (stappen) doorlopen om van een wazige vlek naar een perfect antwoord te komen, zelfs als het antwoord al lang duidelijk was.

De Ontdekking: De AI weet het antwoord al halverwege!

De onderzoekers van dit paper (Prophet) hebben iets verrassends ontdekt. Ze keken naar hoe de AI denkt tijdens het "scherp maken".

De Analogie van de Puzzel:
Stel je voor dat je een enorme puzzel legt.

  1. Stap 1: Je hebt alleen de randen en een paar losse stukjes. Het is nog een rommeltje.
  2. Stap 50 (Halverwege): Je hebt de meeste stukjes gelegd. De randen zijn er, en het centrale plaatje is duidelijk zichtbaar. Je ziet al precies wat het beeld is.
  3. Stap 100 (Einde): Je maakt de laatste kleine hoekjes nog net iets scherper, maar het plaatje is al 100% duidelijk.

De onderzoekers ontdekten dat bij veel vragen (zoals wiskundepuzzels of meerkeuzevragen) de AI het correcte antwoord al ziet op het moment dat ze halverwege zijn. Ze hoeven niet de laatste 50% van de tijd te blijven "nadenken" om het antwoord te vinden; het antwoord is er al, maar de AI blijft maar doorgaan met het perfectioneren van de details.

De Oplossing: "Prophet" (De Profeet)

Op basis van deze ontdekking hebben ze een nieuwe methode bedacht, genaamd Prophet.

Hoe werkt het?
Stel je voor dat je een veiligheidscontroleur bent die meekijkt terwijl de AI aan het puzzelen is.

  • Normaal gesproken zegt de AI: "Ik moet 100 rondjes doen, dus ik doe gewoon 100 rondjes."
  • Met Prophet kijkt de controleur continu naar de zekerheid van de AI.
    • Vraag: "Weet de AI al zeker wat het antwoord is?"
    • Check: De AI vergelijkt haar beste antwoord met haar tweede beste antwoord. Als het verschil enorm groot is (bijvoorbeeld: 99% zeker dat het "540" is, en 1% dat het iets anders is), dan is het antwoord "vastgezet".

Het Moment van "All-in":
Zodra de controleur ziet dat de AI het antwoord al weet (de "zekerheidskloof" is groot genoeg), roept hij: "Stop! We zijn klaar!"
In plaats van de resterende rondjes te doen, pakt de AI direct het huidige antwoord en geeft het terug.

Waarom is dit geweldig?

  1. Snelheid: Omdat de AI vaak halverwege (of zelfs eerder) het antwoord al weet, besparen ze enorm veel tijd. In tests was de AI tot 3,4 keer sneller zonder dat het antwoord slechter werd.
  2. Geen extra training: Je hoeft de AI niet opnieuw te leren. Je plakt er gewoon een slimme "controleur" (Prophet) omheen die beslist wanneer gestopt moet worden.
  3. Slimme timing: De methode is niet dom. Als het antwoord nog onzeker is (bijvoorbeeld bij een heel moeilijke code-puzzel), blijft de AI gewoon doorgaan tot het einde. Hij stopt alleen als hij zeker weet dat hij gelijk heeft.

Samenvattend in één zin:

Prophet is als een slimme assistent die ziet dat de AI het antwoord al heeft gevonden halverwege het proces, en daarom de rest van de tijd bespaart door direct te zeggen: "Oké, we weten het al, hier is het antwoord!"

Dit maakt deze nieuwe generatie AI-modellen veel sneller en praktischer voor taken zoals wiskunde, programmeren en logisch redeneren.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →