Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets

Die Studie zeigt, dass unter gleichen Token-Budgets für das Nachdenken Einzelagenten-Systeme Multi-Agenten-Systemen bei mehrstufiger Schlussfolgerung überlegen sind und viele vermeintliche Vorteile letzterer auf unausgewogene Rechenressourcen sowie methodische Verzerrungen zurückzuführen sind.

Dat Tran, Douwe Kiela

Veröffentlicht 2026-04-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das große Rätsel: Ein Genie allein oder ein Team von Experten?

Stellen Sie sich vor, Sie haben eine sehr knifflige Aufgabe zu lösen – vielleicht ein komplexes Rätsel, das mehrere Schritte erfordert, um die Antwort zu finden.

In der Welt der künstlichen Intelligenz (KI) gibt es zwei Hauptansätze:

  1. Der Einzelkämpfer (Single-Agent): Ein einziges, sehr starkes KI-Modell denkt sich alles selbst aus. Es hat einen langen, durchgehenden Gedankenstrom.
  2. Das Team (Multi-Agent System): Ein Team aus mehreren KIs arbeitet zusammen. Einer plant, einer sucht Fakten, einer kritisiert, einer fasst zusammen. Sie schicken sich Nachrichten hin und her.

Bisher dachte man: „Das Team muss doch besser sein! Mehr Köpfe, mehr Ideen." Aber diese neue Studie von Stanford sagt etwas Überraschendes: Wenn man den Ressourcenverbrauch genau gleich hält, gewinnt fast immer der Einzelkämpfer.

Der entscheidende Vergleich: Der „Gedanken-Budget"

Das Problem bei früheren Vergleichen war, dass Teams oft einfach mehr Rechenaufwand (mehr „Gedanken-Tokens") verbrauchten. Sie schrieben einfach mehr Texte, diskutierten länger und nutzten mehr Rechenkraft. Das ist wie ein Fußballteam, das 11 Spieler hat, aber jeder darf 100 Minuten spielen, während der Einzelkämpfer nur 10 Minuten hat. Natürlich gewinnt das Team!

Die Forscher haben hier einen fairen Vergleich gemacht: Gleiche Zeit, gleiche Rechenkraft.
Sie haben ein festes „Gedanken-Budget" (z. B. 1.000 Wörter, die die KI zum Nachdenken verwenden darf) festgelegt. Dieses Budget wurde dann entweder dem Einzelkämpfer gegeben ODER auf das Team aufgeteilt.

Das Ergebnis: Der Einzelkämpfer war genauso gut oder sogar besser als das Team.

Warum ist das so? Die Analogie vom „Informationen-Verlust"

Stellen Sie sich Information wie Wasser vor, das durch ein Rohr fließt.

  • Der Einzelkämpfer: Das Wasser fließt direkt von der Quelle (der Frage) zum Ziel (der Antwort) durch ein großes, gerades Rohr. Nichts geht verloren.
  • Das Team: Das Wasser muss durch mehrere kleine Behälter gegossen werden. Jeder Behälter ist ein anderer KI-Agent. Agent A nimmt das Wasser, schüttet es in einen Eimer, Agent B nimmt den Eimer, schüttet es weiter, und so weiter.

Jedes Mal, wenn das Wasser von einem Agenten zum nächsten weitergegeben wird (die „Nachricht"), kann etwas verschüttet werden oder verdunsten. In der Wissenschaft nennt man das den Datenverarbeitungs-Ungleichheit. Einfach gesagt: Je mehr Zwischenschritte und Nachrichten es gibt, desto wahrscheinlicher ist es, dass wichtige Informationen verloren gehen oder verzerrt werden. Der direkte Weg (Einzelkämpfer) ist effizienter.

Wann gewinnt dann doch das Team?

Das Team ist nicht komplett nutzlos. Die Studie zeigt, wann es Sinn macht:
Stellen Sie sich vor, der Einzelkämpfer ist in einem sehr lauten, chaotischen Raum (ein langer, verwirrender Text mit vielen irrelevante Details). Er kann sich nicht konzentrieren und verliert den Faden.
In diesem Fall hilft das Team: Ein Agent filtert den Lärm heraus, ein anderer sortiert die wichtigen Fakten. Wenn der „Raum" zu chaotisch für einen einzelnen Kopf ist, hilft die Aufteilung der Arbeit.

Aber in einem normalen, klaren Umfeld ist der Einzelkämpfer schneller und präziser.

Ein wichtiger Fund: Die „Zauber-Formel" der KI-Firmen

Die Forscher haben noch etwas Spannendes entdeckt, besonders bei den Modellen von Google (Gemini).
Wenn man einer KI sagt: „Denke nach, bis du 10.000 Wörter erreicht hast", passiert oft etwas Seltsames:

  • Das Team (Multi-Agent) schreibt tatsächlich viel Text, weil jeder Agent etwas schreibt.
  • Der Einzelkämpfer (Single-Agent) hört oft schon viel früher auf zu schreiben, obwohl er eigentlich noch „Geld" im Budget hat. Er denkt vielleicht intern weiter, aber er schreibt es nicht auf.

Das bedeutet: Viele frühere Studien, die sagten „Teams sind besser", haben sich vielleicht nur auf die Anzahl der geschriebenen Wörter verlassen, nicht auf die tatsächliche Rechenkraft. Es war ein Trick des Messsystems. Wenn man fair misst, gewinnt der Einzelkämpfer.

Fazit für den Alltag

Die Botschaft der Studie ist beruhigend und effizient:
Wir müssen nicht immer komplexe Teams von KI-Agenten aufbauen, um schwierige Probleme zu lösen. Oft reicht ein starker, einzelner KI-Assistent, der einfach genug Zeit zum Nachdenken bekommt.

  • Für einfache bis mittlere Aufgaben: Ein einziger, kluger Kopf ist besser. Er verliert keine Informationen auf dem Weg und nutzt sein Budget effizienter.
  • Für extrem chaotische Aufgaben: Ein Team kann helfen, wenn die Informationen so verworren sind, dass ein einzelner Kopf sie nicht mehr sortieren kann.

Die Zukunft liegt also nicht unbedingt in immer größeren KI-Schwärmen, sondern darin, den einzelnen KI-Modellen die richtigen Werkzeuge und den nötigen Raum zum Nachdenken zu geben, ohne sie in unnötige Bürokratie (viele Agenten-Nachrichten) zu verwickeln.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →