RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring

Die Studie stellt RefAgent vor, ein Multi-Agenten-Framework auf Basis von Large Language Models, das durch spezialisierte Agenten für Planung, Ausführung und Testen Software-Refaktorierungen automatisiert und dabei im Vergleich zu Einzelagenten sowie traditionellen Tools signifikant höhere Erfolgsquoten bei der Code-Qualität und der Beseitigung von Code-Smells erzielt.

Khouloud Oueslati, Maxime Lamothe, Foutse Khomh

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung des Papers „RefAgent" auf Deutsch, verpackt in eine anschauliche Geschichte.

Das Problem: Der verstaubte Hausbau

Stell dir vor, du hast ein riesiges, altes Haus (ein Softwareprogramm), das du bewohnst. Im Laufe der Jahre haben viele verschiedene Leute darin gearbeitet. Manche haben Wände verschoben, ohne zu schauen, ob die Leitungen noch passen. Andere haben Möbel in den Weg gestellt oder Fenster zugemauert.

Das Haus steht noch, aber es ist unordentlich, schwer zu renovieren und wenn du versuchst, ein neues Zimmer hinzuzufügen, bricht vielleicht das ganze Dach zusammen. In der IT nennen wir das „technische Schulden" oder „Code-Smells" (Code-Gestank).

Früher mussten Menschen (Programmierer) dieses Chaos manuell aufräumen. Das ist mühsam, fehleranfällig und dauert ewig. Einfache Roboter (alte Software-Tools) konnten nur sehr einfache Dinge tun, wie z. B. eine Farbe ändern, aber sie verstanden den ganzen Kontext des Hauses nicht.

Die Lösung: RefAgent – Ein Team aus Spezialisten

Die Autoren dieses Papers haben eine neue Idee entwickelt: RefAgent.

Stell dir RefAgent nicht als einen einzelnen Super-Roboter vor, sondern als ein gut organisiertes Bauteam, bei dem jeder eine spezielle Aufgabe hat. Alle Mitglieder dieses Teams nutzen eine extrem intelligente KI (ein „Large Language Model" oder LLM), die wie ein genialer Architekt denkt, aber sie arbeiten zusammen, statt alle gleichzeitig zu reden.

Das Team besteht aus vier Hauptakteuren:

  1. Der Planer (Context-Aware Planner):

    • Rolle: Der erfahrene Bauleiter.
    • Aufgabe: Er läuft durch das Haus, schaut sich die Pläne an und sagt: „Hier ist die Treppe zu schmal, und hier hängen die Leitungen falsch." Er erstellt einen genauen Plan, was geändert werden muss, bevor jemand einen Hammer schwingt. Er achtet darauf, dass die Änderungen mit dem Rest des Hauses harmonieren.
  2. Der Umsetzer (Refactoring Generator):

    • Rolle: Der geschickte Handwerker.
    • Aufgabe: Er nimmt den Plan des Bauleiters und führt die Arbeiten aus. Er baut die Treppe um, zieht neue Leitungen. Aber er ist vorsichtig: Er fragt ständig nach, ob alles passt.
  3. Der Bauleiter-Prüfer (Compiler Agent):

    • Rolle: Der Sicherheitsinspektor für die Struktur.
    • Aufgabe: Nach jeder Änderung prüft er: „Ist das Haus noch stabil? Stehen die Wände noch?" Wenn etwas wackelt (ein Fehler im Code), schickt er den Handwerker sofort zurück, um es zu reparieren.
  4. Der Test-Prüfer (Tester Agent):

    • Rolle: Der Qualitätskontrolleur.
    • Aufgabe: Er stellt sicher, dass das Haus funktioniert. Wenn der Handwerker eine Tür umgebaut hat, prüft der Tester: „Kann man sie noch öffnen? Geht das Licht noch an?" Er nutzt sogar Roboter, die extra Test-Läufe simulieren (EvoSuite), um sicherzugehen, dass nichts kaputt geht.

Der geheime Trick: Der Kreislauf des Lernens

Das Besondere an RefAgent ist, dass es nicht einfach nur „einfach so" arbeitet. Es nutzt einen Feedback-Kreislauf.

Stell dir vor, der Handwerker baut eine Wand. Der Sicherheitsinspektor sagt: „Achtung, die Wand steht schief!" Der Handwerker korrigiert es. Der Qualitätskontrolleur sagt: „Okay, aber jetzt klemmt die Tür." Der Handwerker korrigiert es erneut.

Dieser Prozess läuft bis zu 20 Mal für jede Änderung. Das Team reflektiert über seine Fehler, lernt daraus und verbessert sich Schritt für Schritt, bis alles perfekt sitzt. Ein einzelner Roboter würde wahrscheinlich nach dem ersten Fehler aufgeben oder etwas Falsches bauen. Dieses Team gibt nicht auf.

Was haben sie herausgefunden?

Die Forscher haben RefAgent an acht echten, großen Software-Projekten getestet (wie bei einem echten Hausbau-Check). Die Ergebnisse waren beeindruckend:

  • Sicherheit: Das Haus ist nach der Renovierung immer noch bewohnbar. 90 % der Tests bestanden (das Haus steht noch).
  • Ordnung: Der „Code-Gestank" wurde um mehr als die Hälfte (52,5 %) reduziert. Das Haus ist jetzt viel aufgeräumter.
  • Qualität: Dinge wie Wiederverwendbarkeit (man kann Räume leichter umbauen) haben sich um fast 9 % verbessert.
  • Vergleich: Wenn man nur einen einzelnen Roboter (ein einfaches KI-Tool) benutzt, scheitern die meisten Versuche oder das Haus wird instabil. Das Team (RefAgent) ist deutlich besser.

Fazit

RefAgent ist wie ein autonomes, selbstkorrigierendes Bauteam aus KI-Experten. Es denkt voraus, arbeitet in Schichten, prüft ständig die Sicherheit und lernt aus Fehlern.

Es zeigt, dass die Zukunft der Software-Entwicklung nicht darin liegt, einen einzigen super-smarten Roboter zu haben, sondern ein Team aus spezialisierten Agenten, die zusammenarbeiten, komplexe Aufgaben zu lösen, die für einen einzelnen zu schwer wären. Es macht Software sauberer, sicherer und leichter zu warten – ganz ohne dass ein Mensch den ganzen Tag über den Code wischen muss.