Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

Die Arbeit stellt Evo vor, ein neuartiges Sprachmodell, das autoregressive und diffusionsbasierte Generierung in einem kontinuierlichen evolutionären Rahmen vereint, um durch adaptive Balance zwischen beiden Paradigmen sowohl hohe Generierungsqualität als auch schnelle Inferenz zu erreichen.

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin

Veröffentlicht 2026-03-10
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du schreibst einen Roman. Wie gehst du dabei vor?

Die meisten heutigen KI-Modelle (wie die bekannten Chatbots) arbeiten wie ein strenger Chronist. Sie schreiben Wort für Wort von links nach rechts. Sobald sie ein Wort gewählt haben, ist es fest. Wenn sie später merken, dass der Satz eigentlich einen anderen Anfang brauchen würde, können sie nicht mehr zurück. Sie müssen den Fehler einfach mitnehmen und hoffen, dass der Rest des Satzes ihn irgendwie „rettet". Das ist schnell, aber manchmal führt es zu logischen Fehlern oder unsinnigen Sätzen, weil der Chronist zu sehr in der Vergangenheit steckt.

Andere Modelle, die auf Diffusions-Technik basieren (ähnlich wie Bild-KIs, die aus Rauschen Bilder erschaffen), arbeiten wie ein Träumer. Sie haben zuerst eine vage Idee im Kopf und verfeinern diese langsam. Sie können den ganzen Text gleichzeitig ansehen und ihn immer wieder umschreiben, bis er perfekt ist. Das führt zu sehr logischen und kreativen Ergebnissen, dauert aber ewig, weil sie den Text oft 20- oder 30-mal durchgehen müssen, bevor er fertig ist.

Das Problem

Bisher musste man sich entscheiden: Entweder der schnelle Chronist (schnell, aber manchmal fehleranfällig) oder der langsame Träumer (perfekt, aber langsam).

Die Lösung: Evo

Das Papier stellt Evo vor. Evo ist wie ein meisterhafter Architekt, der beide Fähigkeiten in sich vereint.

Stell dir Evo so vor:
Evo schreibt nicht einfach nur Zeile für Zeile. Es hat eine Art „unsichtbaren Bauplan" (einen latenten Pfad), auf dem jeder Satz und jedes Wort reist.

  1. Der Bauplan (Der „Träumer"-Teil):
    Zu Beginn ist der Text noch unscharf, wie ein Nebel. Evo nutzt hier die Kraft des Träumers. Es plant die grobe Struktur, die Logik und die großen Ideen. Es weiß: „Hier muss ein komplexes mathematisches Problem gelöst werden." In diesem unscharfen Zustand kann es den gesamten Text überblicken und Fehler vermeiden, bevor sie entstehen.

  2. Die Verfeinerung (Der „Chronist"-Teil):
    Sobald Evo merkt, dass ein Teil des Textes (z. B. ein einfaches Wort wie „der" oder „und") klar und sicher ist, schaltet es sofort in den schnellen Modus. Es fixiert dieses Wort und schreibt es fest. Es muss diesen Teil nicht mehr umschreiben.

  3. Die Magie: Der adaptive Takt
    Das Geniale an Evo ist, dass es für jedes einzelne Wort selbst entscheidet, wie lange es braucht, um „reif" zu sein.

    • Bei einem einfachen Wort (z. B. „Hallo") denkt Evo: „Das ist einfach!" -> Es fixiert es sofort (wie ein Chronist).
    • Bei einer schwierigen mathematischen Formel denkt Evo: „Moment, das ist komplex. Ich muss noch ein bisschen im Nebel planen und umschreiben." -> Es verweilt im Träumer-Modus, bis die Lösung klar ist.

Warum ist das so cool?

  • Geschwindigkeit: Weil Evo nur bei den schwierigen Teilen „langsam" ist und bei den einfachen Teilen blitzschnell schreibt, ist es fast so schnell wie ein normaler Chatbot. Es verschwendet keine Zeit damit, einfache Wörter immer wieder neu zu erfinden.
  • Qualität: Weil es bei den schwierigen Teilen (wie Mathe, Code oder Logik) den „Träumer"-Modus nutzt, macht es viel weniger Fehler als die reinen Chronisten-Modelle.
  • Einheit: Es ist nicht zwei verschiedene Modelle, die zusammenarbeiten. Es ist ein einziges Gehirn, das weiß, wann es planen und wann es ausführen muss.

Ein einfaches Bild zum Schluss

Stell dir vor, du malst ein Bild:

  • Der alte Chronist setzt den Pinsel auf und malt sofort die Details, ohne nachzudenken. Wenn er einen Fehler macht, ist das Bild ruiniert.
  • Der langsame Träumer nimmt einen ganzen Tag, um das Bild immer wieder leicht zu übermalen, bis es perfekt ist.
  • Evo ist wie ein Künstler, der zuerst schnell die groben Umrisse skizziert (Planung). Sobald er sieht, dass der Himmel klar ist, malt er ihn sofort fest. Aber bei dem komplizierten Gesicht in der Mitte bleibt er stehen, betrachtet es lange, korrigiert die Nase und den Mund mehrmals, bevor er es festhält.

Das Ergebnis: Ein perfektes Bild, das in der Hälfte der Zeit entsteht, die der Träumer braucht, und mit der Qualität, die der Chronist nie erreichen würde. Evo bringt also das Beste aus beiden Welten zusammen, indem es den Text wie einen lebendigen Organismus wachsen lässt, der genau dort reift, wo er es braucht.