Each language version is independently generated for its own context, not a direct translation.
Imaginez que vous dirigez une équipe de construction. Avant de commencer à bâtir une maison, vous devez estimer combien de temps et d'effort cela va prendre. Dans le monde du développement logiciel, on utilise une unité de mesure un peu mystérieuse appelée « points d'histoire » (story points). Ce n'est pas une heure ni un jour, mais une estimation relative de la difficulté d'une tâche.
Traditionnellement, les développeurs se réunissent pour jouer à un jeu appelé « Poker de Planification » pour décider de ces points. C'est long, subjectif et ça demande beaucoup d'énergie mentale.
Cette étude cherche à répondre à une question simple : Peut-on demander à une intelligence artificielle très avancée (un « Grand Modèle de Langage » ou LLM) de faire ce travail à notre place ?
Voici l'explication de leurs découvertes, imagée comme une aventure de cuisine et de comparaison.
1. Le Défi : L'IA peut-elle cuisiner sans recette ? (Zero-Shot)
Imaginez que vous donnez à un chef étoilé (l'IA) une liste d'ingrédients (la description d'une tâche logicielle) et que vous lui demandez : « Combien de temps va prendre la cuisson ? » sans lui donner aucune recette ni aucun exemple de votre cuisine spécifique.
- L'expérience : Les chercheurs ont demandé à quatre chefs IA (DeepSeek, Kimi, Gemini, OpenAI) de deviner les points d'histoire sur 16 projets différents, sans aucun entraînement préalable.
- Le résultat : C'est incroyable ! Même sans avoir jamais vu vos projets, ces chefs IA ont deviné mieux que des systèmes traditionnels qui avaient lu 80% de vos recettes passées.
- La métaphore : C'est comme si un chef qui n'a jamais visité votre maison pouvait deviner, juste en regardant vos ingrédients, que faire un gâteau au chocolat prendra plus de temps que de faire une salade, et même estimer à quel point il sera plus long. L'IA a une « intuition » générale très forte.
2. L'Amélioration : Donner quelques exemples (Few-Shot)
Même si l'IA est douée, elle ne connaît pas vos goûts spécifiques. Que se passe-t-il si vous lui donnez cinq exemples de tâches précédentes avec leurs temps de cuisson exacts ?
- L'expérience : On donne à l'IA cinq petites cartes avec des exemples de tâches et leurs points.
- Le résultat : La précision s'améliore considérablement.
- L'astuce de la sélection : Il y a deux façons de choisir ces cinq exemples :
- La méthode « Fréquence » : Choisir les 5 tâches les plus courantes (ex: 5 petites salades).
- La méthode « Échelle » (Gagnante) : Choisir une tâche très facile, une très difficile, et trois dans le milieu.
- La leçon : La méthode « Échelle » fonctionne mieux. C'est comme si vous disiez au chef : « Voici comment on fait une salade, voici comment on fait un banquet, et voici des plats intermédiaires ». Cela aide l'IA à comprendre l'échelle de votre cuisine, pas juste la moyenne.
3. Le Grand Mythe : Comparer est-il plus facile ?
Il existe une théorie humaine selon laquelle il est plus facile de dire « Le plat A demande plus d'effort que le plat B » (comparaison) que de dire « Le plat A demande 5 heures » (chiffre exact). C'est plus intuitif pour les humains.
- L'expérience : Les chercheurs ont demandé à l'IA de faire exactement cela : comparer deux tâches et dire laquelle est plus difficile.
- Le résultat surprenant : Non, ce n'est pas plus facile pour l'IA.
- La métaphore : Pour un humain, comparer deux photos est facile. Pour l'IA, elle semble avoir besoin de « calculer » un chiffre interne pour faire la comparaison. Quand on lui demande de comparer directement, elle fait plus d'erreurs que quand on lui demande de donner un chiffre. L'IA pense différemment des humains : elle a besoin de nombres, même si elle ne les dit pas toujours.
4. L'Alternative : Utiliser les comparaisons comme « étiquettes »
Même si l'IA n'est pas meilleure pour prédire une comparaison, peut-on utiliser des comparaisons (faites par des humains) pour entraîner l'IA ?
- L'expérience : On donne à l'IA des exemples du type : « Tâche A > Tâche B » (A est plus dur que B) et on lui demande de deviner les points d'histoire.
- Le résultat : Cela fonctionne très bien ! Pour certains modèles d'IA plus « légers » (comme Gemini), utiliser des comparaisons humaines est même meilleur que de leur donner des chiffres exacts.
- La métaphore : C'est comme si vous ne pouviez pas donner de recette précise à un apprenti, mais vous pouviez lui dire : « Ce gâteau est plus dur que celui-là ». Pour certains apprentis (les petits modèles), cette information relative est plus précieuse que des chiffres abstraits.
En résumé : Ce que cela change pour vous
- Pas besoin de données : Vous pouvez utiliser l'IA pour estimer vos projets logiciels dès le premier jour, même sans historique. Elle est déjà assez intelligente pour faire un bon travail.
- Un peu d'aide suffit : Donner seulement 5 exemples bien choisis (du plus petit au plus grand) rend l'IA très précise.
- L'IA n'est pas humaine : Ne comptez pas sur elle pour faire des comparaisons simples comme le ferait un humain. Elle préfère les chiffres, même si elle doit les inventer.
- L'avenir de l'estimation : Les équipes peuvent maintenant utiliser l'IA pour gagner du temps. Si vous avez un modèle d'IA puissant, donnez-lui des exemples chiffrés. Si vous avez un modèle plus petit ou limité, donnez-lui des comparaisons simples (« ceci est plus dur que cela ») et il s'adaptera parfaitement.
C'est une nouvelle façon de travailler où l'IA agit comme un assistant très rapide qui comprend le contexte, réduisant la fatigue mentale des équipes de développement.