SuperADD: Training-free Class-agnostic Anomaly Segmentation -- CVPR 2026 VAND 4.0 Workshop Challenge Industrial Track

L'article présente SuperADD, un pipeline de segmentation d'anomalies sans entraînement et agnostique aux classes qui exploite un backbone DINOv3 et des techniques de prétraitement robustes pour atteindre des performances de pointe sur le jeu de données MVTec AD 2 dans des conditions de décalages de distribution difficiles, sans nécessiter de réglage des hyperparamètres par classe.

Auteurs originaux : Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

Publié 2026-05-15✓ Author reviewed
📖 5 min de lecture🧠 Analyse approfondie

Auteurs originaux : Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

Article original sous licence CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Ceci est une explication générée par l'IA de l'article ci-dessous. Elle n'a pas été rédigée par les auteurs. Pour une précision technique, consultez l'article original. Lire la clause de non-responsabilité complète

Imaginez que vous êtes le responsable du contrôle qualité dans une usine massive. Votre travail consiste à repérer de minuscules défauts sur des produits défilant sur un convoyeur. Habituellement, vous disposez d'une équipe d'experts qui ont étudié des milliers de produits parfaits. Ils savent exactement à quoi devrait ressembler une prise murale, un morceau de tissu ou un pot de confiture « parfaits ». S'ils voient quelque chose qui ne correspond pas à cette mémoire parfaite, ils le signalent comme un défaut.

Cependant, il y a un piège : l'éclairage de l'usine change constamment. Parfois il est vif, parfois tamisé, parfois les ombres sont étranges. Cela confond les experts car le même produit parfait apparaît différemment sous des lumières variées. Ils pourraient commencer à crier « Défaut ! » alors qu'il ne s'agit en réalité que d'une ombre, ou pire, ils pourraient manquer une véritable fissure parce que la lumière la dissimule.

Ce papier présente un nouveau système ultra-intelligent appelé SuperADD, conçu pour résoudre exactement ce problème. Voici comment il fonctionne, décomposé en concepts simples :

1. Le super-pouvoir « Sans entraînement »

La plupart des systèmes d'IA sont comme des élèves qui doivent passer des mois en classe pour apprendre à quoi ressemble un défaut pour chaque produit spécifique. Si vous introduisez un nouveau produit ou changez l'éclairage, vous devez les renvoyer à l'école pour tout réapprendre.

SuperADD est différent. C'est comme un détective qui n'a pas besoin d'étudier le produit spécifique à l'avance. Il utilise un « cerveau » pré-entraîné (appelé DINOv3) qui a déjà vu des millions d'images provenant d'Internet. Il sait à quoi ressemblent généralement les textures et les formes « normales ». Parce qu'il n'a pas besoin d'être re-entraîné pour chaque nouvelle ligne d'usine, il peut être déployé instantanément. C'est une solution « plug-and-play ».

2. La stratégie de la « Banque de Mémoire »

Au lieu d'essayer de mémoriser chaque image parfaite individuelle, le système construit une Banque de Mémoire.

  • Imaginez que vous preniez une photo d'une prise murale parfaite.
  • Le système découpe cette photo en milliers de minuscules pièces de puzzle (patchs).
  • Il sauvegarde l'« essence » de ces pièces dans une immense bibliothèque (la Banque de Mémoire).
  • Lorsqu'un nouveau produit arrive sur la ligne, le système le découpe en les mêmes pièces de puzzle et demande : « Ai-je une correspondance parfaite pour cette pièce dans ma bibliothèque ? »
  • Si une pièce ne correspond à rien dans la bibliothèque, elle est signalée comme étrange (une anomalie).

3. L'astuce du « Puzzle Chevauchant »

La version originale de ce système avait un problème : elle examinait le produit en grands blocs non chevauchants. Si un défaut se trouvait exactement sur la ligne entre deux blocs, le système pourrait le manquer ou se confondre, comme essayer de lire un mot coupé en deux par la reliure d'un livre.

SuperADD résout cela en utilisant des patchs chevauchants. Imaginez regarder le produit à travers une fenêtre qui glisse, mais cette fenêtre est si grande qu'elle chevauche la vue précédente. Cela garantit que peu importe où se trouve un défaut, il est vu clairement sous plusieurs angles, rendant le système beaucoup plus fiable.

4. Le « Simulateur d'Éclairage »

Pour se préparer aux changements d'éclairage de l'usine, le système ne regarde pas simplement les photos d'entraînement telles quelles. Il assombrit et éclaircit artificiellement les images pendant sa phase de configuration. C'est comme s'entraîner pour un examen en étudiant dans une pièce sombre, puis dans une pièce lumineuse, et enfin dans une pièce avec des lumières clignotantes. Cela entraîne le système à ignorer les changements d'éclairage et à se concentrer uniquement sur la forme et la texture réelles du produit.

5. La « Fermeture Morphologique » (La Colle)

Parfois, le système repère un défaut, mais le résultat ressemble à une ligne brisée et pointillée au lieu d'une rayure solide. C'est comme voir une rayure sur une voiture mais seule la partie centrale est mise en évidence.

Pour corriger cela, SuperADD utilise une étape appelée Fermeture Morphologique. Imaginez cela comme une colle magique. Elle examine les points de surlignage brisés et pointillés et connecte doucement les points pour former une forme solide et lisse. Elle comble également les tout petits trous à l'intérieur de la zone du défaut, garantissant que le rapport final présente une image complète et nette du problème.

Les Résultats

Le système a été testé lors d'une compétition difficile (la piste industrielle VAND 4.0) en utilisant un ensemble de données appelé MVTec AD 2, qui inclut des éléments délicats comme des boîtes métalliques brillantes, des bocaux transparents et des tas de riz.

  • Le Défi : Les données de test présentaient des conditions d'éclairage différentes de celles des données d'entraînement, et le système devait fonctionner sur tous les types d'objets différents en utilisant les mêmes paramètres (sans réglage personnalisé pour chaque objet).
  • Le Résultat : SuperADD a gagné. Il a obtenu les scores les plus élevés parmi tous les concurrents.
    • Il a correctement identifié les défauts dans le Tissu environ 88 % du temps.
    • Il a correctement identifié les défauts dans le Riz environ 74 % du temps.
    • Plus important encore, il a battu les méthodes précédentes les meilleures, prouvant que vous n'avez pas besoin d'une IA complexe et entraînée sur mesure pour chaque produit individuel pour obtenir d'excellents résultats.

Résumé

SuperADD est une méthode intelligente, flexible et rapide pour repérer les défauts d'usine sans avoir besoin de ré-entraîner l'IA pour chaque nouveau produit ou changement d'éclairage. Il utilise un cerveau pré-entraîné, examine les produits en pièces chevauchantes pour éviter de manquer des détails, s'entraîne avec de faux changements d'éclairage pour rester robuste, et utilise de la « colle » pour s'assurer que la carte finale des défauts est propre et complète. C'est une solution « taille unique » qui convient en réalité très bien.

Noyé(e) sous les articles dans votre domaine ?

Recevez des digests quotidiens des articles les plus récents correspondant à vos mots-clés de recherche — avec des résumés techniques, dans votre langue.

Essayer Digest →