FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Die FOR-Prompting-Methode ist ein asynchrones Prompting-Protokoll, das durch die Rollenverteilung zwischen Verteidiger, Fragesteller und Moderator eine selbstkorrigierende, objektionsbasierte Verfeinerung von Antworten ermöglicht und dabei ohne Training oder starke Agenten sowohl bei mathematischen als auch bei offenen Aufgaben die Leistung von Sprachmodellen verbessert.

He Zhang, Anzhou Zhang, Jian Dai

Veröffentlicht Tue, 10 Ma
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der Forschungspapier „FOR-Prompting", verpackt in eine Geschichte und mit alltäglichen Vergleichen, damit jeder sie verstehen kann.

Die Grundidee: Ein Streitgespräch, das keine Lösung vorgibt

Stellen Sie sich vor, Sie haben einen sehr klugen, aber manchmal etwas voreiligen Assistenten (das ist die KI). Sie geben ihm eine Aufgabe, zum Beispiel: „Planen Sie eine Reise für eine Gruppe von sechs Personen nach Rio de Janeiro."

Der Assistent schreibt einen Plan. Aber ist er perfekt? Vielleicht hat er vergessen, dass die Gruppe groß ist und keine kleinen Taxis braucht, oder er hat einen Restaurant-Tipp gegeben, der nur für Singles geeignet ist.

In der herkömmlichen KI-Welt würde der Assistent versuchen, sich selbst zu korrigieren („Oh, ich habe einen Fehler gemacht, ich denke nochmal nach..."). Das funktioniert oft nicht gut, weil der Assistent in seiner eigenen Denkblase gefangen ist.

FOR-Prompting ändert das Spiel komplett. Es führt eine zweite Person in den Raum: einen Kritiker (den „Debater").

Die drei Rollen im Theaterstück

Das Papier beschreibt ein System mit drei Schauspielern:

  1. Der Verteidiger (Defender): Das ist der eigentliche KI-Assistent. Seine Aufgabe ist es, die Antwort zu schreiben und zu verbessern. Er ist derjenige, der die Lösung findet.
  2. Der Kritiker (Debater / Questioner): Das ist die neue, spannende Rolle. Seine Aufgabe ist es, keine Lösungen zu liefern! Er darf nur Fragen stellen. Er ist wie ein strenger Lehrer oder ein neugieriger Freund, der sagt: „Bist du sicher?", „Hast du an das Wetter gedacht?", „Was passiert, wenn der Bus ausfällt?" Er drückt den Verteidiger, genauer hinzusehen, ohne ihm die Antwort vorzukauen.
  3. Der Gastgeber (Host): Ein optionaler Schiedsrichter, der am Ende aus dem ganzen Hin und Her den besten, finalen Plan zusammenfasst.

Die große Metapher: Der Architekt und der Bauleiter

Stellen Sie sich vor, Sie bauen ein Haus.

  • Der Verteidiger ist der Architekt, der die Pläne zeichnet.
  • Der Kritiker ist der Bauleiter, der auf die Baustelle kommt.

In alten Methoden (wie „Chain of Thought") würde der Architekt versuchen, selbst zu prüfen, ob seine Pläne gut sind. Er könnte aber übersehen, dass das Fundament zu schwach ist, weil er zu sehr auf das Dach fixiert ist.

Bei FOR-Prompting kommt der Bauleiter und sagt: „Hey Architekt, hast du an den Regen gedacht? Wenn es stürmt, hält das Dach das aus? Und wo sollen die sechs Familienmitglieder schlafen, wenn das Haus voll ist?"

Der Bauleiter gibt keine neuen Pläne ab. Er sagt nicht: „Hier, ich habe dir einen besseren Plan gemalt." Er sagt nur: „Dein Plan hat Lücken."

Dadurch wird der Architekt gezwungen, selbst nachzudenken, die Lücken zu schließen und einen besseren Plan zu zeichnen. Das Ergebnis ist ein Haus, das viel stabiler ist, als wenn der Architekt allein gearbeitet hätte.

Warum ist das so cool? (Die Ergebnisse)

Das Papier zeigt, dass diese Methode in drei Bereichen besonders gut funktioniert:

  1. Mathe-Rätsel: Selbst bei kleinen, schwachen Computern (kleinen KI-Modellen) hilft diese „Fragen-und-Korrektur"-Methode enorm. Es ist, als würde man einem Schüler mit einem Nachhilfelehrer helfen, der nur Fragen stellt, statt ihm die Lösung zu zeigen. Die kleinen Modelle werden plötzlich fast so gut wie die großen.
  2. Fehler finden: Wenn eine KI einen offensichtlichen Fehler macht (z. B. zählt sie Buchstaben in einem Wort falsch), reicht oft eine einzige, gezielte Frage des Kritikers („Bist du sicher, dass es nur vier 'r' sind?"), damit die KI selbst merkt: „Oh, Moment mal, ich habe einen übersehen!" und die Antwort korrigiert.
  3. Kreative Aufgaben: Bei komplexen Plänen (wie der Reise nach Rio) entstehen viel detailliertere und realistischere Ergebnisse. Der Kritiker zwingt den Verteidiger, an Dinge zu denken, die man sonst vergisst (z. B. „Was machen wir, wenn jemand allergisch ist?" oder „Wie kommen wir mit sechs Personen vom Flughafen?").

Das Geheimnis: Asymmetrie (Ungleichgewicht ist okay!)

Ein spannendes Ergebnis des Papers ist, dass man nicht zwei super-intelligente KIs braucht.
Man kann einen sehr starken KI-Assistenten als Verteidiger nehmen und einen kleinen, einfachen KI-Assistenten als Kritiker.

Das ist wie bei einem Profi-Sportler, der von einem einfachen Trainer angefeuert wird. Der Trainer muss nicht wissen, wie man den Weltrekord bricht; er muss nur fragen: „Hast du genug Wasser getrunken?" oder „Bist du bereit?". Der Profi (der Verteidiger) macht dann die schwere Arbeit. Das spart Geld und Rechenleistung, weil der „Kritiker" nicht viel Rechenpower braucht.

Fazit

FOR-Prompting ist im Grunde eine Art „automatisiertes menschliches Feedback".
Statt dass die KI versucht, sich selbst zu verbessern (was oft in Sackgassen führt), wird sie von einer zweiten Instanz durch Fragen herausgefordert.

  • Keine Lösungen vom Kritiker: Nur Fragen.
  • Selbstkorrektur: Der Verteidiger muss die Antworten selbst finden.
  • Ergebnis: Bessere, sicherere und detailliertere Antworten, auch mit weniger Rechenleistung.

Es ist, als würde man einem Künstler nicht sagen, wie er malen soll, sondern ihm nur sagen: „Schau dir dein Bild nochmal genau an – fehlt da nicht etwas?" Und plötzlich wird das Bild viel besser.