VISIONLOGIC: From Neuron Activations to Causally Grounded Concept Rules for Vision Models

Each language version is independently generated for its own context, not a direct translation.

🧠 VISIONLOGIC : Le Détective qui transforme l'IA en logique humaine

Imaginez que vous avez un génie très intelligent (une intelligence artificielle) qui regarde des milliers de photos et devine ce qu'elles représentent (un chien, un chat, une voiture). Le problème ? Ce génie est un mystérieux boîte noire. Il vous dit "C'est un chien", mais si vous lui demandez "Pourquoi ?", il ne répond pas. Il se contente de dire "Je le sens".

Les méthodes actuelles pour comprendre l'IA sont un peu comme des devinettes. Elles disent : "Ah, l'IA a regardé l'herbe, donc elle pense que c'est un chien !" Mais c'est souvent faux. Parfois, l'IA regarde l'herbe juste parce que dans ses photos d'entraînement, les vaches étaient toujours dans l'herbe. Elle confond la corrélation (les deux choses vont souvent ensemble) avec la causalité (c'est la raison pour laquelle la chose existe).

VISIONLOGIC arrive pour changer la donne. C'est un nouveau système qui agit comme un traducteur et un détective en même temps. Voici comment il fonctionne, étape par étape :

1. De l'électricité brute à des "Interrupteurs" (Les Prédicats)

À l'intérieur de l'IA, il y a des millions de petits neurones qui s'allument et s'éteignent comme des ampoules. C'est très confus.

L'analogie : Imaginez un tableau de bord de fusée avec 10 000 voyants qui clignotent. C'est illisible.
Ce que fait VISIONLOGIC : Il apprend à dire : "Si le voyant numéro 42 s'allume fort, c'est qu'il y a une oreille de renard". Il transforme ces signaux électriques bruts en interrupteurs logiques simples (Vrai/Faux). Au lieu de dire "l'IA a vu une forme floue", il dit "L'IA a détecté : OREILLE = VRAI".

2. La construction de règles logiques (Le "Si... Alors...")

Une fois qu'il a ses interrupteurs, VISIONLOGIC ne se contente pas de les lister. Il écrit des règles claires.

L'analogie : C'est comme passer d'une liste de courses en vrac à une recette de cuisine précise.
La règle : "SI (Oreille pointue = Vrai) ET (Museau long = Vrai) ET (Queue touffue = Vrai) ALORS C'EST UN RENARD".
C'est beaucoup plus facile à comprendre pour un humain que de regarder des cartes de chaleur colorées.

3. Le test du détective (La Validation Causale)

C'est ici que VISIONLOGIC est révolutionnaire. Les anciennes méthodes se contentaient de dire : "L'IA a regardé cette zone, donc c'est important." VISIONLOGIC, lui, va tester cette hypothèse.

L'analogie : Imaginez que vous soupçonnez un suspect (une zone de l'image) d'être le coupable. Au lieu de juste le regarder, vous le faites disparaître (vous le cachez avec du bruit ou du flou) et vous voyez si le génie change encore d'avis.
Le test :
1. Vous cachez l'oreille du renard sur la photo.
2. Vous demandez à l'IA : "C'est toujours un renard ?"
3. Si l'IA répond "Non, je ne sais plus", alors BINGO ! Vous avez la preuve que l'oreille est vraiment la cause de la décision.
4. Si l'IA dit toujours "Oui, c'est un renard", alors l'oreille n'était qu'une coïncidence (une fausse piste).

VISIONLOGIC répète ce test des milliers de fois, en affinant la zone cachée (comme un sculpteur qui enlève de la pierre pour trouver la statue) jusqu'à trouver exactement la partie de l'image qui fait basculer la décision.

🏆 Pourquoi c'est génial ?

Plus de mensonges : Il évite les pièges classiques. Par exemple, il ne dira pas "C'est une vache parce qu'il y a de l'herbe". Il dira "C'est une vache parce que j'ai vu des cornes et un museau".
C'est fiable : Il a prouvé que ses règles fonctionnent aussi bien que l'IA originale. Il ne perd pas en précision en essayant d'être compréhensible.
Les humains comprennent mieux : Dans des tests avec de vraies personnes, VISIONLOGIC a permis aux participants de mieux comprendre comment l'IA prenait ses décisions, bien mieux que les méthodes précédentes.

En résumé 🎯

VISIONLOGIC est comme un traducteur universel qui prend le langage cryptique et obscur d'une intelligence artificielle (des millions de neurones) et le transforme en règles de logique simples et vérifiées (comme un manuel d'instructions).

Au lieu de nous dire "Fais-moi confiance, j'ai raison", il nous dit : "Voici exactement pourquoi j'ai raison : j'ai vu ceci, et si je ne voyais pas cela, je me serais trompé." C'est un pas de géant vers une intelligence artificielle fiable, transparente et digne de confiance.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique

Les modèles de vision par ordinateur basés sur l'apprentissage profond (comme les CNN et les Transformers/ViTs) ont atteint des performances remarquables, mais leur nature de "boîte noire" reste un obstacle majeur à leur adoption dans des applications critiques.

Limites des méthodes existantes : Bien que les explications basées sur des concepts (comme TCAV ou ACE) aient amélioré l'interprétabilité par rapport aux cartes d'attribution locales (ex: Grad-CAM), elles reposent presque exclusivement sur des signaux corrélatoires.
Le manque de causalité : Ces méthodes identifient des concepts qui co-occurrent avec une classe dans les données d'entraînement, mais sans valider que ces concepts sont causalement responsables de la décision du modèle. Cela conduit à des explications trompeuses (ex: associer le concept "pré" à la classe "vache" simplement parce qu'ils apparaissent souvent ensemble, alors que le modèle pourrait se fier à d'autres caractéristiques).
Le besoin : Il existe un vide méthodologique pour des concepts interprétables qui soient non seulement sémantiques, mais aussi causalement validés.

2. Méthodologie : Le Framework VISIONLOGIC

VISIONLOGIC est un cadre neuro-symbolique novateur qui génère des explications hiérarchiques sous forme de règles logiques globales basées sur des concepts validés causalement. Le processus se déroule en trois étapes principales :

Étape 1 : Dérivation de prédicats à partir des activations neuronales

Abstraction : Le modèle transforme les activations réelles des neurones (sortie de la dernière couche) en prédicats binaires ( $p_j(x) \in \{0, 1\}$ ).
Apprentissage des seuils : Au lieu d'utiliser des seuils arbitraires, VISIONLOGIC apprend des seuils d'activation ( $T_j$ ) et des paramètres de netteté ( $s_j$ ) pour chaque canal.
Gestion de la polysémie : Pour permettre à un même neurone de coder plusieurs concepts (polysémie), le système définit des prédicats spécifiques à la branche (positif/négatif) et utilise une fenêtre de rang ( $k$ ) pour sélectionner les contributions les plus importantes.
Objectif : Un processus d'enseignement par distillation (knowledge distillation) est utilisé pour apprendre ces seuils de manière à ce que les prédicats binaires puissent approximer les décisions du modèle original.

Étape 2 : Induction de règles logiques et score d'inférence

Règles symboliques : Une fois le vocabulaire de prédicats appris, le système induit des règles logiques de niveau classe (sous forme de Disjonction de Conjonctions - DNF) qui capturent les motifs d'entraînement.
Score d'explication : Pour une nouvelle image, le système calcule un score basé sur le profil de rang des prédicats actifs. La classe prédite est celle dont les prédicats caractéristiques expliquent le mieux les prédicats actifs sur l'image.
Avantage : Cela permet de passer d'une représentation vectorielle dense à des règles logiques compactes et interprétables.

Étape 3 : Ancrage (Grounding) et validation causale des concepts visuels

C'est l'étape cruciale qui distingue VISIONLOGIC des méthodes précédentes.

Tests d'ablation : Pour chaque prédicats, le système identifie la région de l'image qui le déclenche. Il utilise une approche itérative :
1. Initialisation d'une boîte englobante (bounding box).
2. Ablation par bruit : La région est remplacée par du bruit aléatoire. Si le prédicats passe de "actif" à "inactif", la région est considérée comme causalement nécessaire.
3. Raffinement itératif : La boîte est rétrécie jusqu'à trouver la région minimale nécessaire.
4. Vérification de suffisance : On teste si la région seule (sur fond de bruit) suffit à activer le prédicats.
Affinement par segmentation : Des outils comme SAM (Segment Anything Model) ou Mask R-CNN sont utilisés pour aligner les boîtes sur les contours précis des objets.
Consolidation : Les régions validées sont agrégées sur plusieurs images d'une même classe pour former des concepts visuels cohérents et causalement prouvés.

3. Contributions Clés

Framework Neuro-Symbolique : VISIONLOGIC est le premier cadre à combiner l'apprentissage de prédicats basés sur les activations neuronales avec l'extraction de règles logiques globales, reliant ainsi les représentations neuronales au raisonnement symbolique.
Validation Causale Rigoureuse : Contrairement aux méthodes basées sur la corrélation, VISIONLOGIC utilise des tests d'ablation itératifs pour garantir que les concepts découverts sont la cause directe de l'activation des prédicats.
Algorithme de Raffinement Efficace : Une méthode innovante combinant des boîtes englobantes et des masques de segmentation pour localiser précisément les régions causales.
Évaluation Humaine à Grande Échelle : Une étude humaine démontrant que les explications de VISIONLOGIC améliorent significativement la compréhension du comportement du modèle par rapport aux méthodes de l'état de l'art (ACE, CRAFT).

4. Résultats Expérimentaux

Évaluation Humaine (Utilité)

Scénarios : L'évaluation a porté sur trois scénarios réels : détection de biais (Chien Husky vs Loup), identification de stratégies non évidentes (Loutre vs Castor), et compréhension des échecs (Renard roux vs Renard kit).
Performance : VISIONLOGIC a obtenu des scores d'utilité significativement plus élevés que les méthodes de base (Baseline), les cartes de saillance (Control), ACE et CRAFT.
- Dans le scénario "Husky vs Loup", le score d'utilité a atteint 1.25 (contre 1.00 pour la base), indiquant une capacité supérieure à aider les humains à inférer les règles de décision du modèle.
- Les tests statistiques (Kruskal-Wallis et Dunn) confirment que ces améliorations sont significatives ( $p < 0.05$ ).

Performance du Modèle et Règles Logiques

Architectures testées : Le modèle a été évalué sur ResNet, ConvNeXt, ViT et Swin Transformer.
Fidélité et Précision : VISIONLOGIC maintient une forte fidélité aux prédictions du modèle original.
- Sur les images couvertes, la précision Top-5 dépasse 90% pour la plupart des architectures (ex: 97.38% pour ViT, 97.23% pour ConvNeXt).
- Le taux de couverture (fraction d'images pour lesquelles une explication valide est générée) se situe entre 80% et 89%.
Interprétabilité : Les règles extraites sont compactes et les concepts visuels (ex: "tête d'écureuil", "bec d'oiseau", "toit d'église") sont clairement identifiables et cohérents.

Analyse Qualitative

Polysémie : Le système a réussi à identifier que certains prédicats codent pour plusieurs concepts (ex: un même prédicats pour des oreilles de renard et des toits d'église, partageant une géométrie triangulaire).
Structure Globale vs Locale : Certains prédicats capturent la structure globale de l'objet, tandis que d'autres se concentrent sur des parties locales, offrant une hiérarchie d'explication riche.

5. Signification et Impact

VISIONLOGIC représente une avancée majeure vers une IA digne de confiance. En remplaçant les corrélations statistiques par une validation causale, il comble le fossé entre les représentations complexes des réseaux de neurones et le raisonnement humain.

Applications à haut risque : La capacité à fournir des explications causales et fiables est cruciale pour les domaines sensibles (médical, juridique, sécurité).
Détection de biais : Le cadre permet de révéler non seulement ce que le modèle regarde, mais pourquoi cela influence sa décision, aidant ainsi à identifier et corriger les biais systémiques.
Futur : Les auteurs envisagent d'étendre ce cadre pour ancrer les règles logiques dans des caractéristiques visuelles de bas niveau (bords, textures) afin de créer des explications encore plus riches et hiérarchiques.

En résumé, VISIONLOGIC ne se contente pas d'expliquer le modèle ; il fournit une preuve causale de son fonctionnement, rendant l'intelligence artificielle plus transparente, vérifiable et digne de confiance.