Can AI Agents Generate Microservices? How Far are We?

Hoewel AI-agenten microservices kunnen genereren met code van hoge kwaliteit en sterke API-contracten, toont dit onderzoek aan dat onvolledige consistentie en de noodzaak van menselijk toezicht volledige autonomie nog niet mogelijk maken.

Bassam Adnan, Matteo Esposito, Davide Taibi, Karthik Vaidhyanathan

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Kunnen AI-agenten microservices bouwen? Een simpele uitleg

Stel je voor dat je een enorme, drukke stad wilt bouwen. In plaats van één gigantisch gebouw (een monoliet), bouw je honderden kleine, zelfstandige huisjes die allemaal met elkaar praten via straten en brievenbussen. In de softwarewereld noemen we deze huisjes microservices. Elke service doet één specifieke taak (zoals "betalen" of "bestellingen beheren"), maar ze moeten perfect op elkaar aansluiten.

De vraag die deze onderzoekers zich stelden, is simpel: Kunnen slimme AI-assistenten (AI-agenten) deze huisjes voor ons bouwen, of moeten we dat nog steeds zelf doen?

Hier is wat ze ontdekten, vertaald in alledaags taal:

1. De twee manieren van bouwen

De onderzoekers lieten de AI op twee verschillende manieren werken, net als een aannemer die een nieuw huis bouwt:

  • De "Aanbouw" (Incremental): De stad bestaat al. De AI moet een nieuw huisje bouwen dat perfect past bij de bestaande straten en buren. De AI mag de blauwdrukken van de oude huizen bekijken.
    • Het resultaat: Dit ging redelijk goed (ongeveer 50-76% van de tests slaagde), maar de AI werd soms verward door te veel informatie. Als je de AI te veel details gaf over hoe het er nu uitziet, vergat hij soms de basisregels.
  • De "Lege Veld" (Clean State): De AI krijgt alleen een opdracht: "Bouw een huis voor een treinreis." Er is geen bestaande stad, geen blauwdrukken, alleen de opdracht. De AI moet zelf bedenken hoe de straten eruitzien.
    • Het resultaat: Dit verrassend goed! (81-98% van de tests slaagde). Omdat de AI vrijer was om zijn eigen structuur te bedenken, paste hij zich beter aan de opdracht aan, zolang de "brievenbussen" (de API's) maar werkten.

2. De drie bouwers (AI-agenten)

Ze testten drie verschillende AI-agenten, die we kunnen vergelijken met drie verschillende soorten aannemers:

  • De "Snelle, goedkope vakman" (Code Qwen): Hij is snel, kost weinig geld, maar heeft soms hulp nodig om de opdracht goed te begrijpen als hij alleen de basisinformatie krijgt.
  • De "Gedetailleerde, dure expert" (Claude Code): Hij is ook snel en maakt zeer nette, korte plannen. Hij is echter de duurste in de uitvoering.
  • De "Grondige, maar trage meester" (Codex): Hij maakt vaak prachtige, uitgebreide plannen, maar hij is zeer traag. Soms duurt het uren voordat hij klaar is, en hij kost meer tijd dan geld.

3. De verrassende ontdekkingen

  • Minder is meer: Als je de AI te veel details geeft over hoe het oude systeem werkt, gaat hij soms in de war. Soms werkt het beter om de AI alleen de opdracht te geven en te laten zoeken naar de antwoorden.
  • Korte plannen zijn goed: De code die de AI schreef was vaak korter en simpeler dan wat menselijke ontwikkelaars zouden schrijven. Dat klinkt raar, maar het betekent dat de AI soms slimme, efficiënte oplossingen vindt zonder onnodig gedoe.
  • De "Grootte" van de stad telt: De AI deed het veel beter op bekende, populaire projecten (die waarschijnlijk in zijn trainingsdata zaten) dan op eigen, geheime projecten van studenten. Dit is alsof een aannemer een huis kan bouwen omdat hij er al één van heeft gezien, maar moeite heeft met een compleet nieuw ontwerp.

4. Wat betekent dit voor de toekomst?

De conclusie is: De AI is een geweldige assistent, maar nog geen vervanger.

  • Het werkt, maar niet altijd: De AI kan functionerende microservices bouwen, maar je kunt ze niet zomaar loslaten. Je hebt nog steeds een menselijke "hoofdbouwer" nodig om te controleren of alles veilig is en of de nieuwe huisjes echt aansluiten bij de rest van de stad.
  • Kies je gereedschap slim: Als je snelheid en prijs belangrijk vindt, kies dan voor de snellere agenten. Als je een heel complex project hebt, moet je misschien wachten tot de langzamere, grondigere agenten klaar zijn (of hun tijdslimiet verhogen).
  • Geen magische oplossing: We zijn nog niet op het punt waar we zeggen: "AI, bouw de hele stad," en dan gaan we koffie drinken. De AI moet nog steeds worden begeleid, getest en gecontroleerd.

Kort samengevat:
AI-agenten kunnen tegenwoordig al aardig bouwen, net als een slimme robot die een nieuw huisje kan neerzetten. Maar of dat huisje perfect past in de wijk, hangt af van hoe je de robot instrueert en hoe goed je zelf toekijkt. We zijn nog niet klaar om de sleutel aan de robot over te geven, maar we kunnen hem zeker helpen om sneller te werken!