Consistency of AI-Generated Exercise Prescriptions: A Repeated Generation Study Using a Large Language Model

Cette étude révèle que si les prescriptions d'exercice générées par le modèle Gemini 2.5 Flash présentent une forte cohérence sémantique, elles affichent une variabilité notable dans leurs composantes quantitatives, soulignant la nécessité de contraintes structurelles et d'une validation experte avant une utilisation clinique.

Auteurs originaux : Kihyuk Lee

Publié 2026-04-14
📖 4 min de lecture☕ Lecture pause café
⚕️

Ceci est une explication générée par l'IA d'un preprint qui n'a pas été évalué par des pairs. Ce n'est pas un avis médical. Ne prenez pas de décisions de santé basées sur ce contenu. Lire la clause de non-responsabilité complète

Each language version is independently generated for its own context, not a direct translation.

🧠 Le Grand Test de Répétition : L'IA peut-elle être un coach sportif fiable ?

Imaginez que vous avez un super coach sportif virtuel (une intelligence artificielle très avancée) capable de créer des programmes d'exercice sur mesure pour n'importe qui, du patient diabétique au sportif de haut niveau. C'est génial, non ?

Mais il y a un petit souci : si vous demandez la même chose à ce coach 20 fois de suite, va-t-il vous donner exactement la même réponse chaque fois, ou va-t-il changer d'avis comme un chat ?

C'est exactement ce que l'auteur, Kihyuk Lee, a voulu tester. Il a demandé à l'IA (un modèle appelé Gemini) de créer des programmes d'exercice pour 6 types de personnes différentes (des patients malades et des gens en bonne santé) et il a répété la demande 20 fois pour chaque personne. Au total, 120 programmes générés !

Voici ce qu'il a découvert, avec quelques images pour mieux comprendre :


1. Le "Miroir" des Mots (La Cohérence Sémantique)

L'analogie : Imaginez que vous demandez à 20 dessinateurs différents de dessiner un "chat". Si tous les dessins ressemblent à un chat, c'est bon. Mais si l'un dessine un chien et l'autre un poisson, c'est le chaos.

Ce que l'étude a vu :
L'IA est très bonne pour garder le ton et le style. Si vous lui demandez un programme pour un patient diabétique, elle dira toujours "Bonjour, voici un programme doux pour vous". Les mots sont très similaires d'une réponse à l'autre (comme un miroir qui reflète la même image).

  • Le verdict : L'IA est très cohérente dans ses paroles. Elle ne s'embrouille pas dans ses explications.

2. Le "Règlement" du Programme (La Structure FITT)

L'analogie : C'est ici que ça se corse. Imaginez que vous commandez 20 pizzas identiques. La pâte et la sauce sont toujours les mêmes (le style), mais parfois, le pizzaiol met 3 tranches de pepperoni, et parfois 7. Ou alors, il oublie de préciser si la pizza est cuite à 200°C ou 220°C.

Ce que l'étude a vu :
L'IA a du mal à être précise sur les chiffres (la fréquence, l'intensité, le temps).

  • Pour les patients malades (ex: problèmes de genou) : L'IA est prudente. Elle dit presque toujours "marchez doucement". C'est cohérent.
  • Pour les gens en bonne santé (ex: vouloir se muscler) : L'IA devient un peu "artistique". Parfois, elle dit "soulevez 50 kg", parfois "soulevez 60 kg", et parfois elle oublie même de donner un chiffre !
  • Le problème majeur : Pour les exercices de musculation, dans 10 à 25 % des cas, l'IA ne donnait pas de chiffre précis sur la force à utiliser. C'est comme si le coach disait : "Fais-en un peu, mais pas trop, tu verras bien !" Ce n'est pas très utile pour un sportif.

3. Le "Parapluie" de Sécurité

L'analogie : Imaginez que l'IA doit toujours vous donner un parapluie s'il pleut (les avertissements de sécurité).

Ce que l'étude a vu :
L'IA est toujours polie et prudente. Dans 100 % des cas, elle a inclus des avertissements de sécurité ("Attention à votre dos", "Arrêtez si vous avez mal").

  • La nuance : Pour les patients très malades, le parapluie est énorme (elle écrit des pages de précautions). Pour les gens en bonne santé, le parapluie est plus petit (juste quelques lignes). Mais le message de sécurité est toujours là.

🏁 La Conclusion en une phrase

L'IA est un excellent rédacteur qui parle toujours de la même manière, mais c'est un mauvais mathématicien quand il s'agit de donner des chiffres précis pour les exercices.

Pourquoi est-ce important ?
Si vous utilisez cette IA pour prescrire un sport à un patient, vous ne pouvez pas vous fier à elle à 100 % pour les chiffres (combien de répétitions, quelle vitesse). Elle a besoin d'un humain (un vrai coach ou un médecin) pour vérifier les chiffres, comme un chef qui goûte la soupe avant de la servir.

En résumé : L'IA est un super assistant qui sait parler du sport, mais elle a encore besoin d'un expert pour calculer le sport.

Noyé(e) sous les articles dans votre domaine ?

Recevez des digests quotidiens des articles les plus récents correspondant à vos mots-clés de recherche — avec des résumés techniques, dans votre langue.

Essayer Digest →