What Is Missing: Interpretable Ratings for Large Language Model Outputs

Die vorgestellte Arbeit führt das „What Is Missing" (WIM)-Bewertungssystem ein, das natürliche Sprachfeedbacks über fehlende Informationen in skalierbare Bewertungen umwandelt, um durch größere Abstufungen und interpretierbare Labels die Effektivität von Präferenzlernverfahren für Large Language Models zu verbessern.

Nicholas Stranges, Yimin Yang

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Titel: Was fehlt? – Ein neuer Weg, um KI-Modelle besser zu machen

Stell dir vor, du bist ein Koch, der gerade ein neues Rezept für einen perfekten Kuchen entwickelt hat. Du gibst deinen Kuchen einem Kritiker (dem „Richter") und fragst: „Wie gut ist er?"

Das alte Problem: Die Zahlenspielerei
Bisher haben die Richter oft einfach eine Zahl von 1 bis 10 genannt.

  • „Der Kuchen ist eine 8."
  • „Der andere Kuchen ist auch eine 8."

Das Problem dabei: Was genau macht einen Kuchen zu einer 8? Ist er zu trocken? Zu süß? Fehlt ihm die Sahne? Wenn zwei Kuchen beide eine 8 bekommen, weiß der Koch nicht, welcher wirklich besser ist oder was er genau verbessern muss. Es ist wie ein Nebel: Die Zahl sagt dir, dass etwas gut ist, aber nicht warum oder wie viel besser. Oft landen viele Kuchen in der gleichen „Grauzone" (z. B. alle bei 7 oder 8), was es für den Koch unmöglich macht, sich zu verbessern.

Die neue Lösung: „Was fehlt?" (WIM)
Die Forscher aus diesem Papier haben eine brillante Idee: Statt einer Zahl soll der Richter sagen, was genau im Kuchen fehlt.

Stell dir vor, der Richter sagt nicht: „Das ist eine 6."
Sondern er sagt: „Es fehlt ein bisschen Zimt im Teig, und die Sahne ist etwas zu flüssig."

Das ist das WIM-System (Was Is Missing / Was fehlt).

Wie funktioniert das magisch?

  1. Der Vergleich: Der Computer nimmt den Kuchen (die Antwort der KI) und den Text des Richters („Es fehlt Zimt...").
  2. Der Übersetzer: Ein spezielles Werkzeug (ein „Embedding-Modell") übersetzt beide Texte in eine Art unsichtbare Landkarte. Auf dieser Karte sind Punkte, die sich sehr ähnlich sind, auch nah beieinander.
  3. Der Maßstab: Der Computer misst den Abstand zwischen dem Kuchen und dem Text des Richters.
    • Wenn der Richter sagt „Es fehlt gar nichts" (weil der Kuchen perfekt ist), dann ist der Text des Richters sehr kurz oder leer. Der Abstand ist winzig. Das bedeutet: Perfekte Note!
    • Wenn der Richter eine lange Liste mit Fehlern schreibt („Fehlt Zimt, zu viel Mehl, verbrannte Ränder..."), dann ist der Text lang und komplex. Der Abstand zum Kuchen ist groß. Das bedeutet: Viele Fehler, schlechte Note.

Warum ist das so viel besser?

  • Keine Unentschieden mehr: Bei der alten Methode (1-10) gab es oft Unentschieden (zwei Kuchen beide 8). Bei der neuen Methode sind die „Abstände" fast immer unterschiedlich. Ein Kuchen, dem nur ein Gramm Zimt fehlt, bekommt eine andere Note als einer, dem die ganze Backzeit fehlt. Das gibt dem KI-Koch einen viel klareren Hinweis: „Hey, hier musst du nachbessern!"
  • Verständlich: Wenn die KI einen Fehler macht, kann man den Text des Richters lesen und genau verstehen, was schiefgelaufen ist. Man muss nicht raten, was eine „schlechte 4" bedeutet.
  • Flexibel: Es spielt keine Rolle, ob der Richter ein Mensch oder eine andere, stärkere KI ist. Das System funktioniert mit beiden.

Die Analogie des „Spiegelbilds"
Stell dir vor, die KI-Antwort ist ein Spiegelbild.

  • Bei der alten Methode (Zahlen) wird das Bild einfach als „gut" oder „schlecht" abgestempelt.
  • Bei der neuen Methode (WIM) hält der Richter einen Spiegel vor das Bild und zeigt genau auf die Stellen, die verzerrt sind. „Hier ist das Ohr zu groß", „Hier fehlt der Hut". Je mehr Verzerrungen der Spiegel zeigt, desto weiter ist das Bild von der Perfektion entfernt.

Das Ergebnis
Die Forscher haben getestet, ob diese Methode die KI tatsächlich besser macht. Das Ergebnis war eindeutig:

  • Die KI lernte schneller (der „Verlust" sank stärker).
  • Die KI wurde selbstbewusster (weniger zufälliges Raten).
  • Sie gewann öfter gegen andere KIs in Tests.

Fazit für den Alltag
Statt uns zu fragen: „Wie gut war das?" (was oft nur zu vagen Zahlen führt), fragen wir jetzt: „Was genau fehlt noch, damit es perfekt ist?"
Diese kleine Änderung im Denken – weg von der abstrakten Zahl hin zum konkreten Mangel – hilft den Computern, menschliche Vorlieben viel besser zu verstehen und sich schneller zu verbessern. Es ist, als würde man einem Schüler nicht nur eine Note geben, sondern ihm den genauen Satz zeigen, den er im Aufsatz verbessern muss.