Each language version is independently generated for its own context, not a direct translation.
Stell dir vor, du möchtest einen langen, komplexen Roman schreiben. Normalerweise würdest du das Wort für Wort tun: Du denkst nach, schreibst ein Wort, überprüfst es, denkst nach, schreibst das nächste. Das ist langsam, weil du bei jedem Schritt den ganzen Prozess neu durchlaufen musst.
Das Problem: Der schnelle Assistent, der sich verirrt
Um schneller zu sein, hast du einen schnellen Assistenten (das sogenannte „Draft Model"). Dieser Assistent versucht, dir die nächsten 10 Wörter vorzuschreiben, bevor du sie überhaupt selbst schreibst. Du (der „Ziel-Modell"-Autor) überprüfst dann nur, ob diese Vorschläge Sinn ergeben. Wenn ja, nimmst du sie alle auf einmal an. Das spart enorm viel Zeit.
Aber hier liegt das Problem: Der Assistent ist nicht perfekt. Er schaut nur auf das, was gerade geschrieben wurde. Wenn er bei Wort 1 einen kleinen Fehler macht, macht er bei Wort 2 einen etwas größeren Fehler, bei Wort 3 noch einen größeren. Nach ein paar Wörtern hat er sich so weit vom richtigen Weg entfernt, dass du seine Vorschläge verwerfen musst. Das nennt man „Fehlerakkumulation". Er verliert den Faden.
Die Lösung: ConFu – „Denke über die Zukunft nach"
Die Forscher haben eine neue Methode namens ConFu (Contemplate the Future) entwickelt. Die Idee ist genial einfach: Bevor der Assistent die Wörter vorschlägt, gibt ihm der Autor einen kleinen „Gedankenblitz" oder eine „Landkarte" für die Zukunft.
Stell dir das so vor:
- Der normale Assistent: Schaut nur auf deine Hand, die gerade schreibt, und versucht zu erraten, was als Nächstes kommt.
- Der ConFu-Assistent: Der Autor flüstert ihm leise zu: „Pass auf, ich denke gerade daran, dass wir in diesem Absatz über eine Reise nach Italien gehen werden."
Dank dieses Hinweises („Contemplate Token") weiß der Assistent nicht nur, welches Wort als Nächstes kommt, sondern auch, in welche Richtung die Geschichte geht. Er bleibt auf dem richtigen Pfad, macht weniger Fehler und seine Vorschläge werden viel öfter akzeptiert.
Wie funktioniert das technisch? (Die magischen Werkzeuge)
- Die „Pause-Taste" (Contemplate Tokens): Normalerweise muss ein Computer bei jedem Wort neu rechnen. ConFu fügt eine spezielle „Pause" ein. In dieser Pause rechnet der große Autor nicht das nächste Wort aus, sondern erstellt eine Art „Zukunfts-Vektor" (eine Art unsichtbarer Kompass), der dem Assistenten sagt, wohin die Reise geht. Das kostet fast keine extra Zeit.
- Der intelligente Übersetzer (MoE): Nicht jede Geschichte braucht den gleichen Rat. Bei einem Mathe-Rätsel ist der „Gedankenblitz" anders als bei einem Liebesroman. ConFu nutzt ein System namens „Mixture-of-Experts" (eine Gruppe von Spezialisten). Je nach Kontext wählt es den richtigen Spezialisten aus, um den perfekten Zukunfts-Hinweis zu geben. Es ist wie ein Schalter, der je nach Situation den besten Navigator aktiviert.
- Das Training mit Ankerpunkten: Um den Assistenten zu trainieren, übt man nicht bei jedem einzelnen Wort, sondern bei ausgewählten „Ankerpunkten". Man zeigt ihm: „Wenn wir hier stehen, ist die Zukunft so." Und dann lernt er, dass diese Zukunft auch für die Wörter kurz davor und danach gilt. Das macht ihn robuster.
Das Ergebnis
In Tests mit modernen KI-Modellen (wie Llama-3) hat sich gezeigt, dass ConFu den Assistenten so gut führt, dass er 8 % bis 11 % mehr Wörter auf einmal richtig vorhersagen kann als die bisherigen besten Methoden (EAGLE-3).
Zusammenfassung in einem Satz:
ConFu gibt dem schnellen KI-Assistenten einen Blick in die Kristallkugel, damit er nicht nur das nächste Wort, sondern die ganze Richtung der Geschichte versteht – und dadurch viel schneller und genauer schreibt, ohne dass der Haupt-Autor langsamer wird.
Das ist ein großer Schritt, um KI-Modelle schneller und effizienter zu machen, ohne ihre Intelligenz zu verändern.