Axiomatic On-Manifold Shapley via Optimal Generative Flows

Deze paper introduceert een nieuwe theorie voor on-manifold Shapley-attributie die gebruikmaakt van optimale generatieve stromen om artefacten te elimineren en wiskundig bewezen stabiele, geometrisch consistente verklaringen voor XAI te leveren.

Cenwei Zhang, Lin Zhu, Manxi Lin, Lei You

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een heel slimme, maar mysterieuze robot hebt die foto's bekijkt en zegt: "Dit is een kat!" of "Dit is een auto!". Je vraagt je af: "Waarom denk je dat? Welke delen van de foto waren het belangrijkst?"

Dit is wat Explainable AI (XAI) doet: het probeert de gedachten van de robot te onthullen. Een populaire methode hiervoor heet Shapley-waarden. In het kort: het probeert te berekenen hoeveel elk klein stukje van de foto (bijvoorbeeld één pixel) heeft bijgedragen aan het eindresultaat.

Maar hier zit een groot probleem, en dat is waar dit nieuwe artikel over gaat.

Het Probleem: De "Valse" Baseline

Stel je voor dat je de robot vraagt: "Wat zou je zeggen als dit stukje van de foto er niet was?"
Om dit te beantwoorden, moet de robot iets invullen op die plek. Meestal gebruiken onderzoekers een heel saaie, grijze vlek of een wazige achtergrond als "standaard" (de baseline).

Het probleem is dat deze grijze vlekken niet bestaan in de echte wereld. Een kat heeft geen grijze vlekken op zijn oren; een auto heeft geen wazige plekken op zijn wielen.
Wanneer de robot naar zo'n onnatuurlijke, grijze plek kijkt, raakt hij in de war. Hij ziet dingen die er niet zijn (artefacten) en geeft een verkeerde uitleg. Het is alsof je iemand vraagt wat hij zou denken als hij op de maan zou staan, terwijl hij nog nooit buiten de aarde is geweest. Zijn antwoord is dan puur speculatie, geen echte logica.

De Oplossing: De "Optimale Stroom"

De auteurs van dit paper zeggen: "Laten we stoppen met het invullen van valse, grijze plekken. Laten we in plaats daarvan een natuurlijk pad volgen."

Ze gebruiken een wiskundig concept dat lijkt op waterstromen of windstromen.

  1. Het Idee van de Stroom:
    Stel je voor dat je een foto van een wolk (de "standaard") hebt en je wilt die langzaam transformeren in een foto van een echte kat (de "data"). In plaats van de kat plotseling op de wolk te plakken (wat vreemd en onnatuurlijk is), laten we de wolk langzaam veranderen. De wolken veranderen in vacht, de vacht krijgt vorm, en de oren komen tevoorschijn.
    Dit pad van verandering is een stroom (flow). Het blijft de hele tijd op een "natuurlijk pad" (het manifold), wat betekent dat elke tussenvorm eruitziet als iets dat in de echte wereld zou kunnen bestaan.

  2. De Kortste Weg (De Geodeet):
    Er zijn oneindig veel manieren om een wolk in een kat te veranderen. Je kunt het langzaam doen, je kunt het snel doen, je kunt er gekke bochten in maken.
    De auteurs zeggen: "Laten we de meest efficiënte, rechtste weg kiezen." In de wiskunde noemen ze dit een geodeet. Het is alsof je de kortste, meest energiezuinige route kiest tussen twee punten.
    Ze gebruiken een techniek genaamd Optimal Transport (optimale vervoer). Dit zorgt ervoor dat de verandering van de ene foto naar de andere zo soepel en logisch mogelijk verloopt, zonder rare sprongen.

Waarom is dit beter?

  • Geen Valse Werelden: Omdat het pad altijd door "natuurlijke" beelden gaat, raakt de robot niet in de war door onbestaande grijze vlekken. De uitleg die hij geeft, is gebaseerd op echte, logische veranderingen.
  • Stabiliteit: Als je een andere willekeurige route kiest, krijg je misschien een ander antwoord. Maar als je de kortste, meest efficiënte route kiest, krijg je altijd hetzelfde, eerlijke antwoord. Het is de "standaard" route.
  • Betrouwbaarheid: De auteurs bewijzen wiskundig dat als je deze specifieke route kiest, de uitleg die je krijgt de enige juiste manier is om de bijdrage van elk pixel te meten, volgens de regels van de speltheorie (Shapley).

De Analogie: De Reis van A naar B

Stel je voor dat je een reisplanner hebt die moet uitleggen waarom je van punt A (een lege foto) naar punt B (een foto van een hond) bent gegaan.

  • De oude manier: De planner zegt: "We zijn eerst naar een vreemde, grijze dimensie gegaan die er niet bestaat, en toen plotseling naar de hond." De uitleg is verwarrend en onbetrouwbaar.
  • De nieuwe manier (dit paper): De planner zegt: "We zijn een soepele, natuurlijke weg gevolgd. We zijn langzaam van een wazige vorm naar een snuit gegaan, toen naar oren, en toen naar poten. Elke stap was logisch."

Conclusie

Dit paper introduceert een nieuwe, wiskundig perfecte manier om AI's uit te leggen. In plaats van te raden wat er zou zijn als een deel van de foto weg was (wat vaak tot rare, onnatuurlijke resultaten leidt), volgen ze een natuurlijk, soepel pad door de wereld van mogelijke beelden.

Ze gebruiken wiskunde om de "kortste en snelste" route te vinden tussen een standaardbeeld en de echte foto. Hierdoor krijgen we uitleggen die niet alleen wiskundig correct zijn, maar ook betrouwbaar en logisch voor mensen om te begrijpen. Het is alsof we eindelijk een GPS hebben die de echte weg volgt, in plaats van een route die door de lucht vliegt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →