DerMAE: Improving skin lesion classification through conditioned latent diffusion and MAE distillation

L'article présente DerMAE, une méthode qui améliore la classification des lésions cutanées en générant des images synthétiques via des modèles de diffusion conditionnés et en utilisant l'auto-entraînement MAE suivi d'une distillation de connaissances pour déployer des modèles légers et performants sur des appareils mobiles.

Francisco Filho, Kelvin Cunha, Fábio Papais, Emanoel dos Santos, Rodrigo Mota, Thales Bezerra, Erico Medeiros, Paulo Borba, Tsang Ing Ren

Publié 2026-02-24
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🩺 Le Problème : Un Médecin qui voit trop de "Bons" et pas assez de "Mauvais"

Imaginez que vous essayez d'apprendre à un jeune médecin (l'intelligence artificielle) à reconnaître les cancers de la peau. Le problème, c'est que dans les livres d'images qu'il utilise pour étudier (les données), il y a 90 % de grains de beauté inoffensifs et seulement 10 % de cancers dangereux.

C'est comme si vous appreniez à un enfant à reconnaître les lions en lui montrant 90 photos de chats et seulement 10 photos de lions. À la fin, l'enfant pensera que tout animal poilu est un chat ! Il va rater les vrais lions (les cancers) parce qu'il n'en a jamais assez vu. C'est ce qu'on appelle le déséquilibre des classes.

🎨 La Solution : Trois Astuces Magiques

Les chercheurs de l'Université Fédérale de Pernambouc (au Brésil) ont inventé une méthode en trois étapes pour résoudre ce problème.

1. L'Imprimeur 3D de Peau (Génération Synthétique)

Au lieu de chercher désespérément plus de photos de vrais cancers (qui sont rares), ils ont créé un imprimeur 3D magique (un modèle de diffusion).

  • Comment ça marche ? C'est comme un artiste qui regarde une photo de cancer, la brouille avec du bruit, puis apprend à la reconstruire parfaitement.
  • L'astuce : Ils ont demandé à l'imprimeur de créer 600 000 nouvelles photos de cancers et de grains de beauté.
  • Le résultat : Soudain, le jeune médecin a un tas de photos équilibrées. Il peut étudier autant de lions que de chats. De plus, ils ont ajouté un "filtre de beauté" (une perte perceptuelle) pour s'assurer que les faux cancers ressemblent vraiment à la vraie peau, et pas juste à des taches floues.

2. L'Entraînement de l'Expert (Pré-entraînement MAE)

Maintenant qu'ils ont beaucoup de photos, ils doivent entraîner un super-héros (un très gros modèle d'IA appelé ViT-Huge).

  • Le jeu : Imaginez que vous cachez 75 % d'une photo de peau avec un cache (c'est le "Masque"). Le super-héros doit regarder les petits bouts qui restent et deviner à quoi ressemble le reste de la peau.
  • Pourquoi ? Cela force l'IA à comprendre la structure globale de la peau (les formes, les contours) plutôt que de juste mémoriser des détails. C'est comme apprendre à reconnaître un visage en ne voyant qu'un œil ou une bouche.
  • Grâce aux 600 000 photos générées, ce super-héros devient un expert infaillible.

3. Le Professeur et l'Élève (Distillation de Connaissances)

Voici le hic : le super-héros (ViT-Huge) est trop lourd ! Il est comme un éléphant dans une boutique de porcelaine : il est trop gros et consomme trop d'énergie pour tenir dans le téléphone portable d'un médecin ou d'une application mobile.

  • La solution : Ils utilisent la distillation de connaissances.
  • L'analogie : Imaginez que le super-héros (le Professeur) a toutes les connaissances du monde. Il ne peut pas voyager léger, alors il prend un petit élève (un modèle plus simple, comme un ViT-Base ou EfficientNet) et lui transmet tout son savoir.
  • Le petit élève ne regarde pas seulement les réponses correctes, il essaie de penser comme le Professeur. Il apprend à voir les nuances que le Professeur voit.
  • Le résultat final : On obtient un petit modèle, léger et rapide, qui tient dans un téléphone, mais qui a l'intelligence du géant.

🚀 Pourquoi c'est génial ?

  1. Plus juste : Grâce aux photos générées, l'IA ne rate plus les cancers rares. Elle est plus précise.
  2. Plus rapide : Grâce à la distillation, on peut utiliser cette IA intelligente directement sur un téléphone portable, même sans connexion internet. C'est parfait pour les zones reculées où il n'y a pas de dermatologue.
  3. Économique : On n'a pas besoin de milliers de vrais patients pour entraîner le système, juste un peu de données réelles et beaucoup de données "fabriquées" intelligentes.

En résumé

Les chercheurs ont dit : "Si nous n'avons pas assez de vrais cancers pour apprendre à l'IA, nous allons en fabriquer de faux mais réalistes. Ensuite, nous allons entraîner un géant sur ces images, et enfin, nous allons lui apprendre à transmettre son génie à un petit modèle qui pourra voyager dans votre poche pour aider les médecins."

C'est une victoire pour la médecine de précision, rendue accessible à tous, partout dans le monde.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →