Axiomatic On-Manifold Shapley via Optimal Generative Flows

Cet article propose une méthode d'attribution Shapley sur-manifold fondée sur des flots génératifs optimaux, qui résout les artefacts hors-manifold en définissant un attribut canonique unique via l'intégrale de ligne du gradient le long des géodésiques de Wasserstein minimisant l'énergie cinétique.

Cenwei Zhang, Lin Zhu, Manxi Lin, Lei You

Publié 2026-03-06
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous avez un modèle d'intelligence artificielle très complexe, comme un expert qui regarde une photo de chat et dit : « C'est un chat ! ». Vous voulez savoir pourquoi il a pris cette décision. Est-ce à cause des oreilles ? De la queue ? De la couleur du pelage ?

C'est là qu'intervient l'explication de l'IA (XAI). Mais il y a un gros problème avec les méthodes actuelles : elles sont souvent comme un peintre qui essaie de comprendre un tableau en le regardant à travers un verre dépoli ou en ajoutant des taches de peinture qui n'existent pas dans la réalité.

Voici une explication simple de la méthode proposée dans ce papier, « Shapley sur la surface via des flux génératifs optimaux », en utilisant des analogies du quotidien.

1. Le Problème : Le « Chemin Fantôme »

Pour expliquer une décision, les anciennes méthodes (comme les « Shapley values » classiques) demandent : « Si on enlève cette partie de l'image, que se passe-t-il ? ». Pour simuler l'absence d'une partie, elles utilisent souvent une image de fond toute noire, floue ou moyenne.

L'analogie : Imaginez que vous essayez de comprendre comment un avion vole en regardant ce qui se passe si vous retirez une aile. Mais au lieu de retirer l'aile, vous la remplacez par un morceau de carton noir. L'avion ne vole plus, mais pas pour la bonne raison ! Le modèle IA réagit à ce « carton noir » (qui n'existe pas dans la vraie vie) et vous donne une explication fausse. C'est ce qu'on appelle un artefact hors-manifold (un chemin qui ne suit pas la logique du monde réel).

2. La Solution : Suivre le « Sentier de la Nature »

Les auteurs disent : « Ne forcez pas le modèle à regarder des choses qui n'existent pas. Faites-le voyager d'un point A (une image floue) à un point B (l'image du chat) en suivant le chemin le plus naturel et le plus court possible, un chemin qui reste toujours dans le monde réel des images. »

C'est là qu'intervient leur idée géniale : Les Flux Génératifs Optimaux.

L'analogie du Voyageur :

  • L'ancienne méthode : C'est comme si vous deviez aller de Paris à Lyon, mais que vous deviez traverser un champ de boue (l'espace vide) pour y arriver. Votre voiture (le modèle) va s'enliser et vous dire des bêtises sur le paysage.
  • La nouvelle méthode : C'est comme si vous utilisiez un GPS qui calcule la route la plus fluide, la plus directe, en restant strictement sur l'autoroute (la « surface des données »). Vous ne quittez jamais la route. Le modèle IA ne voit que des choses qui ressemblent à de vraies images à chaque instant du voyage.

3. Le Secret : La « Géométrie de l'Énergie »

Comment trouvent-ils ce chemin parfait ? Ils utilisent une théorie mathématique appelée Transport Optimal.

L'analogie du Déménagement :
Imaginez que vous devez déplacer un tas de sable (votre image de départ) pour former une montagne (votre image finale).

  • Vous pouvez le faire n'importe comment : en le lançant en l'air, en le traînant dans la boue, etc. C'est inefficace et chaotique.
  • Les auteurs disent : « Trouvons le chemin qui demande le moins d'effort physique (le moins d'énergie cinétique) pour déplacer ce sable. »

Ce chemin « le moins énergivore » est mathématiquement unique. Il est le plus droit possible tout en respectant les lois de la physique (ici, les lois des images). En suivant ce chemin, on obtient une explication canonique (la seule vraie, la plus juste).

4. Pourquoi c'est mieux ? (Les Résultats)

Grâce à cette méthode, ils ont prouvé deux choses importantes :

  1. Stabilité : Si vous refaites le calcul plusieurs fois, vous obtenez toujours le même résultat. Les anciennes méthodes donnaient des résultats qui changeaient au hasard (comme un vent qui souffle dans tous les sens). Ici, c'est comme un fleuve qui suit toujours le même lit.
  2. Clarté : Les explications sont plus nettes. Au lieu de voir des taches de bruit partout sur l'image (comme des points blancs et noirs aléatoires), on voit clairement : « Ah, c'est bien la forme de l'oreille et la moustache qui ont fait dire "Chat" au modèle ».

En Résumé

Ce papier propose une nouvelle façon de faire parler l'IA :

  • Avant : On demandait à l'IA de deviner ce qu'elle pensait d'images fausses et bizarres pour comprendre ses décisions.
  • Maintenant : On demande à l'IA de nous montrer son raisonnement en suivant un chemin de vie (une trajectoire fluide) qui ne sort jamais du monde réel.

C'est comme passer d'une explication faite avec des devinettes hasardeuses à une explication basée sur un voyage logique, direct et économe en énergie. Cela rend l'IA plus fiable, surtout dans des domaines sensibles comme la médecine, où une mauvaise explication peut être dangereuse.