Why Pass@k Optimization Can Degrade Pass@1: Prompt Interference in LLM Post-training

Die Arbeit zeigt, dass die Optimierung von Pass@k die Pass@1-Leistung durch Prompt-Interferenz und daraus resultierende Gradientenkonflikte verschlechtern kann, da der Optimierungsprozess Prompts mit geringer Erfolgschance hochgewichtet und somit die Update-Richtung von der Pass@1-Optimierung wegdreht.

Anas Barakat, Souradip Chakraborty, Khushbu Pahwa, Amrit Singh Bedi

Veröffentlicht 2026-02-27
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das große Problem: Wenn "Viel hilft viel", schadet es dem Einzelnen

Stell dir vor, du hast einen sehr klugen, aber manchmal etwas chaotischen Schüler (das ist unser KI-Modell). Du willst, dass er Matheaufgaben löst.

Es gibt zwei Arten, seine Leistung zu messen:

  1. Pass@1 (Der "Ein-Wurf"-Test): Der Schüler bekommt eine Aufgabe und hat nur einen Versuch. Wenn er sie richtig löst, ist er erfolgreich. Das ist wie eine echte Prüfung, bei der man keine Hilfe hat.
  2. Pass@k (Der "Viel-Versuch"-Test): Der Schüler bekommt die gleiche Aufgabe und darf k-mal raten (z. B. 5 oder 10 Mal). Solange eine seiner 10 Antworten richtig ist, zählt es als Erfolg. Das ist wie ein Quiz, bei dem man so lange tippen darf, bis es passt.

Was die Forscher herausfanden

Bisher dachten viele: "Wenn wir den Schüler trainieren, damit er beim Viel-Versuch-Test (Pass@k) besser wird, wird er automatisch auch beim Ein-Wurf-Test (Pass@1) besser."

Aber das stimmt leider nicht. Die Studie zeigt etwas Überraschendes: Wenn man den Schüler speziell darauf trainiert, beim "Viel-Versuch"-Test zu gewinnen, kann er beim "Ein-Wurf"-Test schlechter werden.

Es ist, als würdest du einen Sportler trainieren, der 100-mal hintereinander einen Ball werfen darf, bis er ein Tor trifft. Er lernt, extrem viele verschiedene, verrückte Würfe zu probieren. Aber wenn er dann plötzlich nur einen Wurf hat, ist er vielleicht so verwirrt von all den verrückten Strategien, dass er den einfachen Wurf verpasst.

Warum passiert das? (Die "Störungs"-Theorie)

Die Forscher nennen das "Prompt-Interferenz" (Störung durch die Aufgaben). Hier ist die Analogie:

Stell dir vor, der Schüler lernt für zwei sehr unterschiedliche Arten von Aufgaben:

  • Leichte Aufgaben: "Was ist 2 + 2?" (Er kann das fast immer sofort).
  • Schwere Aufgaben: "Löse diese komplexe Integralgleichung." (Er scheitert oft).

Das Problem beim Training für Pass@k:
Um beim "Viel-Versuch"-Test besser zu werden, muss das Training den Schüler zwingen, sich auf die schweren Aufgaben zu konzentrieren, bei denen er oft scheitert. Denn bei den leichten Aufgaben ist er ja schon gut; da bringt mehr Probieren nichts.

Das Training sagt also: "Ignoriere die leichten Aufgaben! Wirf alle deine Energie darauf, die schweren Aufgaben zu knacken!"

Der Konflikt:
Hier kommt die "Störung" ins Spiel. Die Art und Weise, wie der Schüler lernt, die schweren Aufgaben zu lösen, ist oft genau das Gegenteil davon, wie man die leichten Aufgaben löst.

  • Um die schweren Aufgaben zu knacken, muss er vielleicht mutig und chaotisch raten.
  • Um die leichten Aufgaben sicher zu lösen, muss er ruhig und präzise sein.

Wenn das Training den Schüler nun übermäßig darauf trainiert, die schweren Aufgaben zu lösen (weil er dort beim Pass@k-Test am meisten "Punkte" holen kann), vergisst er die feinen Nuancen für die leichten Aufgaben. Er wird im "Viel-Versuch"-Test super, weil er endlich die schweren Rätselfälle knackt. Aber im "Ein-Wurf"-Test macht er bei den einfachen Aufgaben Fehler, weil er zu sehr auf das "Raten" für die schweren Aufgaben programmiert wurde.

Die Metapher: Der Architekt und der Maler

Stell dir vor, du hast einen Künstler, der sowohl Architekt (schwere, komplexe Aufgaben) als auch Maler (einfache, schnelle Aufgaben) sein soll.

  • Pass@1 will, dass er jedes Bild sofort perfekt malt.
  • Pass@k will, dass er irgendwann ein perfektes Gebäude entwirft, auch wenn er 100 Skizzen braucht.

Wenn du ihn nur trainierst, wie man 100 Skizzen für ein Gebäude macht (Pass@k), wird er vielleicht ein genialer Architekt. Aber wenn du ihn dann bittest, sofort ein schönes Bild zu malen (Pass@1), wird er vielleicht zögern, weil er immer noch nach den 100 Skizzen sucht. Seine "Architekt-Strategie" stört seine "Maler-Fähigkeit".

Was bedeutet das für die Zukunft?

Die Studie warnt uns: Wir können KI-Modelle nicht blind darauf trainieren, "vielfach zu probieren", wenn wir gleichzeitig wollen, dass sie in der echten Welt (wo wir oft nur einen Versuch haben) zuverlässig funktionieren.

  • Das Risiko: Wenn wir KI nur auf "Vielleicht klappt es ja beim 5. Versuch" optimieren, verlieren wir die Zuverlässigkeit für den ersten Versuch.
  • Die Lösung: Wir müssen neue Trainingsmethoden finden, die den Schüler lehren, sowohl die schweren Rätsel zu knacken als auch die einfachen Aufgaben sicher im ersten Wurf zu lösen, ohne dass sich die beiden Lernziele gegenseitig stören.

Zusammengefasst: Mehr Versuche beim Training führen nicht automatisch zu mehr Erfolg beim ersten Versuch. Manchmal macht das Training für das "Vielfach-Probieren" den Schüler sogar ungeschickter im "Einmal-Versuch".

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →