Axiomatic On-Manifold Shapley via Optimal Generative Flows

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous avez un modèle d'intelligence artificielle très complexe, comme un expert qui regarde une photo de chat et dit : « C'est un chat ! ». Vous voulez savoir pourquoi il a pris cette décision. Est-ce à cause des oreilles ? De la queue ? De la couleur du pelage ?

C'est là qu'intervient l'explication de l'IA (XAI). Mais il y a un gros problème avec les méthodes actuelles : elles sont souvent comme un peintre qui essaie de comprendre un tableau en le regardant à travers un verre dépoli ou en ajoutant des taches de peinture qui n'existent pas dans la réalité.

Voici une explication simple de la méthode proposée dans ce papier, « Shapley sur la surface via des flux génératifs optimaux », en utilisant des analogies du quotidien.

1. Le Problème : Le « Chemin Fantôme »

Pour expliquer une décision, les anciennes méthodes (comme les « Shapley values » classiques) demandent : « Si on enlève cette partie de l'image, que se passe-t-il ? ». Pour simuler l'absence d'une partie, elles utilisent souvent une image de fond toute noire, floue ou moyenne.

L'analogie : Imaginez que vous essayez de comprendre comment un avion vole en regardant ce qui se passe si vous retirez une aile. Mais au lieu de retirer l'aile, vous la remplacez par un morceau de carton noir. L'avion ne vole plus, mais pas pour la bonne raison ! Le modèle IA réagit à ce « carton noir » (qui n'existe pas dans la vraie vie) et vous donne une explication fausse. C'est ce qu'on appelle un artefact hors-manifold (un chemin qui ne suit pas la logique du monde réel).

2. La Solution : Suivre le « Sentier de la Nature »

Les auteurs disent : « Ne forcez pas le modèle à regarder des choses qui n'existent pas. Faites-le voyager d'un point A (une image floue) à un point B (l'image du chat) en suivant le chemin le plus naturel et le plus court possible, un chemin qui reste toujours dans le monde réel des images. »

C'est là qu'intervient leur idée géniale : Les Flux Génératifs Optimaux.

L'analogie du Voyageur :

L'ancienne méthode : C'est comme si vous deviez aller de Paris à Lyon, mais que vous deviez traverser un champ de boue (l'espace vide) pour y arriver. Votre voiture (le modèle) va s'enliser et vous dire des bêtises sur le paysage.
La nouvelle méthode : C'est comme si vous utilisiez un GPS qui calcule la route la plus fluide, la plus directe, en restant strictement sur l'autoroute (la « surface des données »). Vous ne quittez jamais la route. Le modèle IA ne voit que des choses qui ressemblent à de vraies images à chaque instant du voyage.

3. Le Secret : La « Géométrie de l'Énergie »

Comment trouvent-ils ce chemin parfait ? Ils utilisent une théorie mathématique appelée Transport Optimal.

L'analogie du Déménagement :
Imaginez que vous devez déplacer un tas de sable (votre image de départ) pour former une montagne (votre image finale).

Vous pouvez le faire n'importe comment : en le lançant en l'air, en le traînant dans la boue, etc. C'est inefficace et chaotique.
Les auteurs disent : « Trouvons le chemin qui demande le moins d'effort physique (le moins d'énergie cinétique) pour déplacer ce sable. »

Ce chemin « le moins énergivore » est mathématiquement unique. Il est le plus droit possible tout en respectant les lois de la physique (ici, les lois des images). En suivant ce chemin, on obtient une explication canonique (la seule vraie, la plus juste).

4. Pourquoi c'est mieux ? (Les Résultats)

Grâce à cette méthode, ils ont prouvé deux choses importantes :

Stabilité : Si vous refaites le calcul plusieurs fois, vous obtenez toujours le même résultat. Les anciennes méthodes donnaient des résultats qui changeaient au hasard (comme un vent qui souffle dans tous les sens). Ici, c'est comme un fleuve qui suit toujours le même lit.
Clarté : Les explications sont plus nettes. Au lieu de voir des taches de bruit partout sur l'image (comme des points blancs et noirs aléatoires), on voit clairement : « Ah, c'est bien la forme de l'oreille et la moustache qui ont fait dire "Chat" au modèle ».

En Résumé

Ce papier propose une nouvelle façon de faire parler l'IA :

Avant : On demandait à l'IA de deviner ce qu'elle pensait d'images fausses et bizarres pour comprendre ses décisions.
Maintenant : On demande à l'IA de nous montrer son raisonnement en suivant un chemin de vie (une trajectoire fluide) qui ne sort jamais du monde réel.

C'est comme passer d'une explication faite avec des devinettes hasardeuses à une explication basée sur un voyage logique, direct et économe en énergie. Cela rend l'IA plus fiable, surtout dans des domaines sensibles comme la médecine, où une mauvaise explication peut être dangereuse.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique et Contexte

L'explicabilité des modèles d'intelligence artificielle (XAI) repose souvent sur l'attribution de caractéristiques (feature attribution) pour comprendre les décisions d'un modèle. La méthode de référence, basée sur les valeurs de Shapley, est théoriquement solide car elle satisfait des axiomes fondamentaux de la théorie des jeux coopératifs (efficacité, symétrie, etc.).

Cependant, l'application pratique de Shapley aux modèles modernes (notamment en vision par ordinateur) rencontre deux obstacles majeurs :

Sensibilité à la ligne de base (Baseline Sensitivity) : Pour simuler l'absence d'une caractéristique, les méthodes doivent imputer des valeurs manquantes à partir d'une distribution de référence. Le choix de cette ligne de base (image noire, floue, moyenne, etc.) est souvent heuristique. Si cette ligne de base se trouve hors de la variété des données (off-manifold), elle introduit des artefacts qui trompent le modèle, conduisant à des explications instables et trompeuses.
Complexité combinatoire : Le calcul exact des valeurs de Shapley nécessite d'évaluer toutes les sous-ensembles de caractéristiques, ce qui est intraitable pour des entrées de haute dimension. Les méthodes d'intégration de chemin (comme Integrated Gradients) contournent ce problème en intégrant le long d'un chemin, mais le choix de ce chemin (généralement une ligne droite) reste arbitraire et ne garantit pas de rester sur la variété des données.

Objectif de l'article : Développer une théorie formelle pour définir une attribution Shapley sur la variété (on-manifold) qui soit unique, géométriquement optimale et stable, en éliminant le besoin de choix heuristiques de lignes de base ou de trajectoires.

2. Méthodologie Proposée

Les auteurs proposent un cadre théorique basé sur le transport optimal et les flots génératifs continus pour définir un chemin canonique d'attribution.

A. Attribution Aumann-Shapley sur une Trajectoire

Au lieu de considérer des coalitions discrètes, les auteurs généralisent l'attribution à des chemins continus $\gamma$ reliant une référence $x_0$ à l'entrée observée $x$ . L'attribution pour la caractéristique $i$ est définie comme l'intégrale de ligne du gradient du modèle le long de ce chemin :
$\Phi_i(f, \gamma) = \int_0^1 \frac{\partial f}{\partial x_i}(\gamma(t)) \cdot \dot{\gamma}_i(t) \, dt$
Cette formulation satisfait les axiomes classiques de Shapley (efficacité, linéarité, etc.) et une nouvelle propriété cruciale : l'invariance par reparamétrisation (le résultat ne dépend pas de la vitesse de parcours du chemin, mais uniquement de sa géométrie).

B. Théorème de Représentation et Unicité

Les auteurs prouvent un théorème de représentation établissant que, pour un chemin fixe $\gamma$ , l'intégrale de ligne du gradient est l'unique fonctionnelle satisfaisant les axiomes d'efficacité, de linéarité, de dummy, de symétrie, de localité et d'invariance par reparamétrisation. Cela valide l'approche par intégrale de chemin comme la seule solution cohérente avec la théorie de Shapley une fois le chemin défini.

C. Sélection du Chemin par Transport Optimal (OT)

Le défi principal est de choisir le chemin "correct" $\gamma$ . Les auteurs résolvent ce problème en formulant la sélection du chemin comme un problème variationnel :

Ils considèrent l'ensemble de tous les flots qui transportent une distribution de référence simple $p_0$ (ex: Gaussienne) vers la distribution des données $p_1$ .
Ils sélectionnent le flot qui minimise l'action cinétique (énergie cinétique), ce qui correspond à la géodésique de la distance de Wasserstein-2 ( $W_2$ ) selon la formulation dynamique de Benamou-Brenier.
Ce flot optimal induit une famille unique de courbes caractéristiques (trajectoires) sur la variété des données.

D. Définition de l'Attribution Canonique

L'attribution proposée, notée $\Psi$ , est l'intégrale de ligne du gradient le long de cette géodésique de Wasserstein-2.

Théorème de Canonicité : Toute attribution sur la variété qui est à la fois axiomatique (satisfait les propriétés de Shapley) et optimale (minimise le coût de transport) doit coïncider avec $\Psi$ presque partout.
Stabilité : Les auteurs démontrent que l'erreur d'attribution est bornée par l'erreur d'approximation du flot génératif. Si le modèle génératif s'améliore, l'explication converge vers la valeur canonique vraie.

E. Implémentation Pratique

Pour rendre la méthode calculable, les auteurs utilisent des Rectified Flows (RF). Bien que l'OT exact soit difficile à calculer, les RF (et en particulier les modèles "Reflowed" ou itératifs) approximent efficacement les géodésiques de Wasserstein en apprenant des trajectoires quasi-linéaires. L'attribution est calculée numériquement en intégrant le gradient le long de la trajectoire générée par le flot appris.

3. Contributions Clés

Cadre Théorique Unifié : Définition d'une attribution Shapley sur la variété basée sur des flots génératifs optimaux, prouvée unique sous des axiomes géométriques étendus.
Résolution de l'Ambiguïté du Chemin : Transformation du choix heuristique de la ligne de base en un problème d'optimisation géométrique (minimisation de l'énergie cinétique), éliminant l'arbitraire des méthodes existantes.
Garanties de Stabilité : Preuve théorique que l'erreur d'attribution est proportionnelle à l'erreur d'approximation du flot, offrant une garantie de robustesse.
Récupération de la Théorie Classique : Démonstration que pour les modèles additifs, la méthode retrouve exactement les valeurs de Shapley classiques.
Nouvelles Métriques d'Évaluation : Introduction de métriques spécifiques pour évaluer la fidélité géométrique (GPS, FCE) et l'alignement structurel (SATV), au-delà des métriques traditionnelles de fidélité.

4. Résultats Expérimentaux

Les expériences ont été menées sur plusieurs jeux de données (CUB-200, CIFAR-10, CelebA-HQ) et comparées à des méthodes de référence (Integrated Gradients, DDIM, GradientSHAP, etc.).

Vérification Axiomatique : La méthode converge rapidement vers la complétude (somme des attributions = changement de sortie du modèle) avec un nombre raisonnable d'étapes d'intégration (K=50).
Stabilité Géométrique : L'utilisation de flots "Reflowed" (2-RF) qui minimisent l'action cinétique réduit considérablement la variance des cartes d'attribution entre différentes graines aléatoires par rapport aux flots à une étape (1-RF). Il existe une corrélation claire entre la minimisation de l'énergie cinétique et la stabilité de l'explication.
Fidélité et Alignement Structurel :
- FCE (Flow Consistency Error) : La méthode proposée reste strictement sur la variété des données, avec une erreur de consistance du flot réduite de plusieurs ordres de grandeur par rapport aux méthodes de diffusion (DDIM) ou aux lignes droites (IG) qui traversent des régions hors variété.
- SATV (Structure-Aware Total Variation) : Les cartes d'attribution sont plus nettes, moins bruitées et mieux alignées avec les contours sémantiques des objets (ex: yeux, nez sur des visages) que les méthodes concurrentes qui produisent souvent du bruit "fantôme" ou des artefacts.
Évolutivité : La méthode fonctionne efficacement sur des images haute résolution (256x256) sans artefacts de basse résolution, prouvant sa robustesse face à la malédiction de la dimensionnalité.

5. Signification et Impact

Cet article représente une avancée majeure dans le domaine de l'XAI en bridant la théorie du transport optimal avec l'explicabilité des modèles.

Théorique : Il établit que l'attribution Shapley ne doit pas être vue comme un problème combinatoire discret, mais comme un problème géométrique continu sur la variété des données. Il fournit une définition "canonique" qui ne dépend plus des choix arbitraires de l'utilisateur.
Pratique : En éliminant les artefacts liés aux lignes de base hors variété, la méthode offre des explications plus fiables, cruciales pour des domaines à haut risque comme le diagnostic médical ou la finance, où les "hallucinations" d'explication peuvent être dangereuses.
Futur : Le travail ouvre la voie à l'utilisation de modèles génératifs avancés (flots normalisés, transport optimal appris) non seulement pour la génération de données, mais comme colonne vertébrale pour des explications de modèles rigoureuses et mathématiquement fondées.

En résumé, les auteurs démontrent que respecter la géométrie intrinsèque des données n'est pas seulement une contrainte, mais une condition préalable pour obtenir des explications sémantiquement fidèles et stables.