FactorSmith: Agentic Simulation Generation via Markov Decision Process Decomposition with Planner-Designer-Critic Refinement

Die Arbeit stellt FactorSmith vor, ein Framework, das mittels faktorisierter POMDP-Zerlegung zur Kontextreduktion und eines hierarchischen Agenten-Workflows mit Planer-, Designer- und Kritiker-Rollen spielbare Simulationen aus natürlichen Sprachbeschreibungen mit verbesserter Codequalität und geringeren Laufzeitfehlern generiert.

Ali Shamsaddinlou, Morteza NourelahiAlamdari

Veröffentlicht 2026-03-24
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🎮 FactorSmith: Der clefe Game-Designer mit einem Team aus drei Köpfen

Stell dir vor, du möchtest ein neues Videospiel programmieren, aber du hast keine Programmierkenntnisse. Du schreibst einfach einen Text: „Mach ein Spiel, in dem ein Ball von einer Leiter fällt und von einem Frosch gefangen wird."

Früher haben große Sprach-KIs (wie ein sehr gut lesender, aber manchmal verwirrter Assistent) versucht, das ganze Spiel auf einmal zu schreiben. Das Problem? Wenn der Text zu lang oder das Spiel zu komplex wird, verliert der Assistent den Faden. Er erfindet Funktionen, die nicht existieren, oder vergisst Regeln. Das ist, als würde man versuchen, einen ganzen Hochhauskomplex in einem einzigen Satz zu beschreiben – es wird chaotisch.

FactorSmith ist eine neue Methode, die dieses Problem löst. Sie kombiniert zwei geniale Ideen: Zerlegung und Teamarbeit.

1. Die Zerlegung: „Nimm dir nicht zu viel auf einmal vor" 🧩

Stell dir vor, du musst ein riesiges Puzzle bauen. Wenn du versuchst, alle 10.000 Teile auf einmal zu sortieren, wirst du verrückt.
FactorSmith macht etwas anderes: Es zerlegt das Puzzle in kleine, handliche Stapel.

  • Der Trick: Das Spiel wird nicht als ein riesiger Block betrachtet, sondern als eine Reihe von kleinen Schritten (z. B. erst den Ball programmieren, dann die Schwerkraft, dann den Frosch).
  • Der Vorteil: Der KI-Assistent bekommt für jeden Schritt nur die Informationen, die er wirklich braucht. Er muss nicht das ganze Puzzle sehen, sondern nur den kleinen Stapel, an dem er gerade arbeitet. Das nennt man im Fachjargon „faktorierte Zerlegung", aber denk einfach an Fokus.

2. Das Team: Der Planer, der Designer und der Kritiker 🎭

Das ist die eigentliche Magie. Bei früheren Methoden hat der Assistent versucht, den Code sofort perfekt zu schreiben. Wenn er einen Fehler machte, musste er raten, ob er es nochmal versuchen sollte.

FactorSmith führt stattdessen ein Dreier-Team ein, das bei jedem kleinen Schritt zusammenarbeitet:

  • Der Planer (Der Dirigent): Er hält den Takt. Er sagt: „Okay, wir machen jetzt den Ball." Er überwacht den Prozess und entscheidet, wann wir weitermachen oder zurückgehen müssen.
  • Der Designer (Der Architekt): Er schreibt den Code. Er nimmt die Anweisung des Planers und baut das kleine Modul. Aber er ist nicht perfekt – er macht Fehler.
  • Der Kritiker (Der strenge Chef): Er schaut sich den Code des Designers genau an. Er hat eine Checkliste (Ist es korrekt? Fehlt etwas? Sieht es gut aus?). Er gibt eine Punktzahl (z. B. 6 von 10) und sagt: „Hier fehlt eine Kollisionserkennung."

Das Spiel:

  1. Der Designer schreibt etwas.
  2. Der Kritiker prüft es und sagt: „Nicht schlecht, aber 6/10. Hier ist ein Fehler."
  3. Der Planer sagt: „Okay, Designer, mach es nochmal!"
  4. Der Designer verbessert den Code.
  5. Der Kritiker prüft wieder: „Jetzt sind es 9/10!"
  6. Der Planer sagt: „Perfekt! Wir speichern das und gehen zum nächsten Schritt."

Wenn der Designer beim zweiten Versuch schlechter wird (z. B. 4/10), sagt der Planer: „Stopp! Wir gehen zurück zum letzten guten Stand (Checkpoint)." Das verhindert, dass das Projekt in die falsche Richtung abdriftet.

Warum ist das so erfolgreich? 🚀

In den Tests (mit Spielen wie „Snake" oder „Flappy Bird") hat FactorSmith gezeigt, dass es viel weniger Fehler macht als andere Methoden.

  • Ohne Team: Der Assistent schreibt alles auf einmal, wird verwirrt und das Spiel funktioniert nicht.
  • Mit Team: Der Assistent arbeitet in kleinen Schritten, wird ständig geprüft und verbessert, bis alles perfekt ist.

Die Zusammenfassung in einem Satz

FactorSmith ist wie ein Baumeister, der ein riesiges Schloss nicht in einem Rutsch baut, sondern Stockwerk für Stockwerk (Zerlegung) und dabei jedes Stockwerk von einem Architekten entwerfen, von einem Prüfer kontrollieren und von einem Bauleiter genehmigen lässt, bevor das nächste Stockwerk gebaut wird.

Das Ergebnis sind Spiele, die nicht nur funktionieren, sondern auch stabil und fehlerfrei sind – alles automatisch aus einem einfachen Textbefehl heraus.