Can AI Agents Generate Microservices? How Far are We?

Cette étude démontre que, bien que les agents d'IA puissent générer des microservices fonctionnels avec un code de qualité et une bonne adhérence aux contrats d'API, leur incapacité à garantir une cohérence parfaite et leur dépendance à une supervision humaine signifient que la génération entièrement autonome n'est pas encore réalisable.

Bassam Adnan, Matteo Esposito, Davide Taibi, Karthik Vaidhyanathan

Publié Wed, 11 Ma
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous êtes un chef d'orchestre (l'architecte logiciel) qui veut construire un nouveau quartier dans une ville existante. Chaque maison de ce quartier est un microservice : une petite application indépendante qui doit communiquer parfaitement avec ses voisins pour que la ville fonctionne.

Jusqu'à récemment, construire ces maisons demandait des années d'études et des plans très précis. Mais aujourd'hui, nous avons fait appel à des ouvriers intelligents et autonomes : les Agents IA.

Cette étude cherche à répondre à une question simple : Ces ouvriers robots peuvent-ils construire ces maisons seuls, sans qu'on ait à leur tenir la main à chaque brique ?

Voici ce que les chercheurs ont découvert, expliqué comme une histoire de construction.

1. Le Grand Expérience : Deux Scénarios de Construction

Les chercheurs ont testé 3 types d'ouvriers robots (Claude, Codex, et Qwen) sur 4 chantiers différents. Ils ont utilisé deux méthodes de travail très différentes :

  • Scénario A : La Rénovation (Génération "Incremental")

    • L'analogie : Vous donnez à l'ouvrier une maison existante dans un quartier déjà construit. Il doit ajouter une nouvelle pièce (le microservice) en respectant les tuyaux, les câbles et le style des maisons voisines.
    • Le défi : Il ne doit pas casser les connexions existantes.
    • Le résultat : C'est plus difficile qu'on ne le pense ! Les robots ont réussi environ 50 à 76 % du temps. Paradoxalement, plus on leur donnait de détails précis sur la maison existante, moins ils réussissaient bien. Ils avaient tendance à se fier trop à la description et à oublier de regarder les vrais tuyaux dans les murs.
  • Scénario B : Le Nouveau Quartier (Génération "Clean State")

    • L'analogie : Vous donnez à l'ouvrier un terrain vague et un cahier des charges (ex: "Il faut une boulangerie"). Il n'y a aucune maison autour, pas de tuyaux existants. Il doit tout inventer de zéro.
    • Le défi : Il doit imaginer la structure lui-même.
    • Le résultat : Là, les robots ont été étonnants ! Ils ont réussi 81 à 98 % du temps. Pourquoi ? Parce qu'ils étaient libres de construire exactement comme ils l'entendaient, sans avoir à s'adapter à des contraintes invisibles d'une maison voisine.

2. La Qualité du Bâtiment

  • Des maisons plus simples ? Oui. Les maisons construites par les robots étaient souvent plus simples et moins complexes que celles construites par des humains. C'est comme si les robots avaient tendance à faire des maisons minimalistes : pas de décorations inutiles, juste l'essentiel.
  • Est-ce que ça tient ? Parfois, oui. Mais attention : un robot peut construire une boulangerie qui fonctionne parfaitement à l'intérieur, mais qui n'a pas la bonne porte pour que les clients entrent (problème de contrat d'API). C'est là qu'un humain doit vérifier.

3. La Vitesse et le Prix (L'efficacité)

Tous les robots ne se valent pas pour le même travail :

  • Le Robot Rapide et Économe (Code Qwen) : Il travaille vite (environ 7 minutes par maison) et coûte très cher (environ 3 $). C'est le "bon marché" de la construction.
  • Le Robot Précieux (Claude Code) : Il est aussi rapide, mais il coûte beaucoup plus cher (environ 13 $). Cependant, il écrit des plans très concis et précis.
  • Le Robot Lourd (Codex) : Il prend beaucoup de temps (parfois plus d'une heure pour une seule maison !) et coûte cher. Il a tendance à écrire des plans très longs et détaillés, mais ce n'est pas toujours mieux.

Leçon importante : Le fait qu'un robot écrive beaucoup de texte (des plans très longs) ne signifie pas que la maison sera meilleure. Parfois, le robot le plus rapide et le plus court fait le meilleur travail.

4. Les Pièges à Éviter

Les chercheurs ont découvert quelques pièges amusants mais sérieux :

  • La Maladie de la Mémoire : Les robots sont très forts sur les projets célèbres (comme "Train-Ticket" ou "PiggyMetrics") qu'ils ont déjà vus dans leur entraînement. C'est comme s'ils avaient mémorisé les plans de ces maisons spécifiques. Mais dès qu'on leur donne un projet privé et nouveau (comme un projet d'étudiant), ils sont beaucoup moins performants. Ils ne "comprennent" pas vraiment, ils "rappellent".
  • Le Piège des Détails : Dans le scénario de rénovation, donner trop de détails à l'ouvrier (un résumé détaillé) l'a parfois empêché de réussir. Il se focalisait sur le résumé et oubliait de vérifier la réalité du terrain. Mieux vaut lui donner juste le nom de la pièce et le laisser explorer.

Conclusion : Où en sommes-nous ?

Les Agents IA sont devenus d'excellents maçons capables de construire des microservices fonctionnels et propres. Ils peuvent même le faire plus vite et avec moins de complexité que certains humains.

MAIS, nous ne sommes pas encore au stade où l'on peut leur dire "Construis-moi un quartier" et partir en vacances.

  • Ils ont besoin d'un chef de chantier humain pour vérifier que les portes s'ouvrent bien vers les voisins (les contrats API).
  • Ils ne sont pas encore fiables à 100 % sur des projets nouveaux et obscurs.

En résumé : L'IA est un super-assistant qui peut faire 80 % du travail, mais l'architecte humain doit rester là pour valider les 20 % restants qui font la différence entre une maison solide et une catastrophe.