Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

Diese Arbeit stellt ein neuartiges, paralleles Planungs-Aktions-Framework für LLM-basierte Multi-Agenten-Systeme in Minecraft vor, das durch eine duale Thread-Architektur mit unterbrechbarer Ausführung die bisherige sequenzielle Beschränkung überwindet und so eine Echtzeit-Reaktionsfähigkeit in dynamischen Umgebungen ermöglicht.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song

Veröffentlicht 2026-03-10
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache, bildhafte Erklärung der Forschung, als würde man sie einem Freund beim Kaffee erzählen:

Das Problem: Der „Gedanken-und-Tun"-Bottleneck

Stell dir vor, du spielst ein Videospiel wie Minecraft mit einer Gruppe von Freunden. In den meisten aktuellen KI-Systemen (den „Multi-Agenten-Systemen") funktioniert das so: Ein Freund (die KI) denkt sich einen Plan aus, sagt: „Ich gehe jetzt Holz holen", und wartet, bis er das Holz wirklich geholt hat, bevor er sich den nächsten Gedanken macht.

Das ist wie bei einem sehr langsamen Koch, der erst den ganzen Kuchen backen muss, bevor er überlegt, ob er vielleicht doch lieber Pizza machen sollte, weil er gerade sieht, dass die Gäste Hunger haben. In einer dynamischen Welt wie Minecraft, wo sich alles ständig ändert (Monster tauchen auf, andere Spieler greifen an), ist dieses „erst denken, dann tun, dann wieder denken" viel zu langsam und starr.

Die Lösung: Ein Team mit zwei Gehirnen und einem „Notfall-Button"

Die Autoren dieses Papers haben eine neue Art von KI-Team erfunden, das wie ein Eiszeit-Überlebender funktioniert, der gleichzeitig denkt und handelt.

Stell dir jeden KI-Agenten (jeden Spielcharakter) nicht als eine Person vor, sondern als ein Zweikopf-System mit zwei parallelen Arbeitsweisen:

  1. Der „Stratege" (Planungs-Thread): Dieser Kopf sitzt am Tisch, liest die Nachrichten der anderen, schaut auf die Karte und denkt sich neue Pläne aus. Er ist extrem schnell und denkt ständig weiter, auch während die anderen schon loslegen.
  2. Der „Handwerker" (Aktions-Thread): Dieser Kopf führt die Befehle aus. Er hackt Holz, baut Häuser oder kämpft gegen Drachen.

Der Clou: Diese beiden arbeiten gleichzeitig (parallel).

  • Der Stratege denkt: „Oh, ein Drache kommt! Wir müssen sofort weg!"
  • Der Handwerker ist gerade dabei, ein Haus zu bauen.
  • Der Interrupt-Button: Da der Stratege so schnell ist, kann er dem Handwerker sofort einen „Notfall-Button" drücken. Der Handwerker bricht das Hausbauen mitten in der Aktion ab (unterbricht es) und rennt sofort weg, um zu kämpfen.

Früher mussten die KIs erst das Haus fertig bauen, bevor sie auf den Drachen reagieren konnten. Jetzt können sie mitten in der Aktion umschwenken. Das nennt man unterbrechbare Ausführung.

Das Gedächtnis: Ein gemeinsames Whiteboard

Damit das Team funktioniert, braucht es ein gutes Gedächtnis. Früher haben sich die KIs oft nur auf das verlassen, was sie gerade sahen, und wussten nicht, was ihre Teamkollegen gerade sagten oder taten.

Die Autoren haben ein zentrales Gedächtnis (eine Art gemeinsames Whiteboard oder WhatsApp-Gruppe) eingeführt.

  • Wenn Agent A sieht, dass ein Drache kommt, schreibt er das sofort auf das Whiteboard.
  • Agent B liest das Whiteboard sofort mit und weiß: „Oh, Drache! Ich muss mich rüsten!"
  • Es gibt keine Verzögerung. Alle wissen immer, was gerade passiert, egal wer gerade was tut.

Der Werkzeugkasten: Der „Rezept-Koch"

Um komplexe Aufgaben zu lösen (z. B. „Baue eine Diamantrüstung"), müssen viele kleine Schritte gemacht werden: Erst Holz, dann Steine, dann ein Ofen, dann Eisen, dann Diamanten...
Früher musste die KI für jeden dieser Schritte neu nachdenken: „Wie mache ich einen Ofen? Oh, ich brauche Steine. Wie hole ich Steine?" Das dauerte ewig.

Die Autoren haben eine komplette Bibliothek von Fähigkeiten gebaut, die wie ein Rezeptbuch funktioniert.

  • Wenn die KI sagt: „Ich brauche Diamantrüstung", schaut das Rezeptbuch nach.
  • Es weiß automatisch: „Dafür brauchst du Eisen, dafür brauchst du Kohle, dafür brauchst du einen Spitzhacke."
  • Die KI muss nicht jedes kleine Detail neu erfinden. Sie ruft einfach das Rezept auf, und das System erledigt die ganzen kleinen Schritte (Rekursives Zerlegen) automatisch im Hintergrund.

Das Ergebnis: Schnellere, schlauere Teams

In den Tests haben diese neuen KI-Teams in Minecraft gezeigt, dass sie viel besser sind als die alten Systeme:

  • Sie können Drachen besiegen (eine der schwersten Aufgaben im Spiel), indem sie ihre Taktik mitten im Kampf ändern, wenn der Drache angreift.
  • Sie sammeln Ressourcen viel schneller, weil sie sich nicht gegenseitig blockieren.
  • Sie kämpfen in „König-gegen-König"-Kämpfen (PvP) viel besser, weil sie sofort auf die Bewegungen des Gegners reagieren können, statt stur ihren alten Plan zu verfolgen.

Zusammenfassung in einem Satz

Statt wie ein langsamer Einzelgänger zu sein, der erst alles plant und dann handelt, ist dieses neue System wie ein gut koordiniertes Spezialeinsatzkommando, bei dem jeder Soldat gleichzeitig denkt, handelt und sofort auf die Signale seiner Kameraden reagiert, ohne auch nur eine Sekunde zu zögern.