Joint Distribution-Informed Shapley Values for Sparse Counterfactual Explanations

Each language version is independently generated for its own context, not a direct translation.

🥗 De "Kool en Varkensvlees" van AI-verklaringen

Stel je voor dat je een AI-adviseur hebt die je vertelt waarom je een hypotheekafkeuring hebt gekregen. De AI zegt: "Je wordt afgewezen omdat je inkomen te laag is, je leeftijd te hoog is, je woont in een verkeerde straat en je hebt te veel creditcard-schulden."

Dit is een tegenfeitelijke verklaring (Counterfactual Explanation): een lijstje met dingen die je moet veranderen om "Ja" te krijgen.

Maar hier zit een addertje onder het gras:

Te veel veranderingen: De AI vraagt je misschien om je leeftijd te veranderen (onmogelijk!) of je hele leven te veranderen. Dat is niet praktisch.
Verkeerde focus: Soms zegt de AI: "Verander je inkomen," terwijl het eigenlijk genoeg zou zijn om je creditcard-schulden iets lager te maken. De AI geeft je een te lange boodschappenlijstje, terwijl je maar één ding nodig hebt.

De auteurs van dit paper, Lei You en collega's, hebben een nieuwe methode bedacht genaamd COLA. De naam staat voor COunterfactuals with Limited Actions (Tegenfeitelijke verklaringen met beperkte acties).

🚕 De Taxi-analogie: Hoe werkt COLA?

Stel je voor dat je in een stad woont (je huidige situatie, de Feitelijke Data) en je wilt naar een feestje (het Gewenste Resultaat, bijvoorbeeld "Hypotheek Goedgekeurd").

De eerste taxi (De oude methode):
Je belt een standaard taxi-app. Die app zegt: "Om bij het feestje te komen, moet je eerst naar de overkant van de stad rijden, dan een omweg maken via de snelweg, en dan nog even parkeren."
- Het probleem: De route is te lang, te duur en je moet veel veranderingen doorvoeren. De app heeft geen idee van de beste route, hij kijkt alleen naar de afstand.
De nieuwe methode (COLA):
COLA werkt als een slimme navigatie die twee dingen combineert:
- Optimale Transport (OT): Dit is alsof de navigatie eerst een kaart maakt van alle mogelijke routes en de kortste, meest efficiënte verbinding zoekt tussen jouw huidige locatie en het feestje. Het kijkt niet alleen naar de afstand, maar naar de structuur van de stad.
- Shapley-waarden (De slimme passagier): Dit is een wiskundige methode die bepaalt welke specifieke straat het belangrijkst is om te veranderen. In plaats van te zeggen "verander alles", zegt deze passagier: "Nee, we hoeven alleen maar die ene afslag te nemen. De rest is onbelangrijk."

COLA pakt de lange, dure route van de eerste taxi en snijdt die terug tot de kortste, meest logische route.

🧩 Het geheim: Hoe vinden ze de juiste weg?

Het paper introduceert een nieuwe techniek genaamd p-SHAP.

Het oude probleem: Vaak kijken AI-modellen naar willekeurige voorbeelden om te beslissen wat belangrijk is. Dat is alsof je iemand vraagt hoe je naar een feestje komt, terwijl die persoon nooit in die stad is geweest. Ze geven je dan een verkeerd advies.
De COLA-oplossing: p-SHAP gebruikt een wiskundige techniek (Optimale Transport) om precies te matchen wie bij wie hoort. Het zegt: "Jij (de feitelijke situatie) hoort bij dát specifieke alternatief (het tegenfeitelijke scenario)."

Door deze perfecte match te maken, weet de AI precies welke knoppen hij moet draaien. Het resultaat? Je hoeft veel minder dingen te veranderen om hetzelfde doel te bereiken.

📊 Wat zeggen de cijfers? (De "Proef" in het paper)

De auteurs hebben COLA getest op 4 verschillende datasets (zoals kredietverzoeken en hotelboekingen) met 12 verschillende AI-modellen.

Het resultaat: COLA bereikte hetzelfde succes (bijvoorbeeld: "Hypotheek Goedgekeurd") met slechts 26% tot 45% van de veranderingen die de oude methoden nodig hadden.
In mensentaal: Als de oude AI zei: "Verander 10 dingen in je leven om een hypotheek te krijgen," zegt COLA: "Verander er maar 3 of 4. Je komt er net zo goed mee."

🎯 Waarom is dit belangrijk?

Actiegericht: Mensen kunnen dingen doen. Het is veel makkelijker om je creditcard-schulden te verlagen dan om je inkomen te verdubbelen. COLA geeft je de kleinste stap die werkt.
Onafhankelijk: Het werkt met bijna elk type AI-model (of het nu een boomstructuur is of een diep neurale netwerk). Je hoeft niet te weten hoe de AI precies in elkaar zit.
Veilig: Het voorkomt dat je onmogelijke dingen moet doen (zoals je leeftijd veranderen), omdat het zich concentreert op de meest efficiënte, haalbare veranderingen.

🏁 Conclusie

Dit paper introduceert COLA, een slimme "tweede opinion" voor AI-verklaringen. Het pakt de vaak rommelige, overbodige adviezen van AI-modellen en snijdt ze terug tot de essentie.

Het is alsof je van een lange, verwarrende instructiehandleiding ("Doe stap 1 tot 100") overschakelt naar een helder advies van een lokale gids: "Doe alleen stap 3 en 7, dan ben je er."

Dankzij COLA krijgen mensen niet alleen een verklaring voor waarom ze iets niet krijgen, maar ook een realistisch en haalbaar plan om het wel te krijgen.

Each language version is independently generated for its own context, not a direct translation.

Titel: Joint Distribution-Informed Shapley Values for Sparse Counterfactual Explanations (COLA)

Auteurs: Lei You, Yijun Bian, en Lele Cao.
Publicatie: ICLR 2026.

1. Probleemstelling

Counterfactual explanations (CE) zijn een cruciale techniek in Explainable AI (XAI) die aangeeft hoe kleine wijzigingen in invoerkenmerken de voorspelling van een model kunnen omkeren (bijv. van "geen lening" naar "welke lening"). Hoewel er honderden CE-algoritmen bestaan, hebben ze vaak een belangrijk nadeel: ze wijzigen meer kenmerken dan strikt noodzakelijk is om het gewenste resultaat te bereiken. Dit vermindert de duidelijkheid en actieerbaarheid van de uitleg voor de gebruiker.

De kernvraag die dit paper adresseert is:

Gegeven een (groep van) feitelijke instantie(s), hoe kunnen we een actieplan ontwerpen dat de minimale hoeveelheid kenmerkaanpassingen vereist om een gewenst counterfactual resultaat te bereiken?

De uitdagingen zijn:

Geen enkel bestaand CE-algoritme is universeel toepasbaar op alle scenario's (individueel vs. groep vs. distributie).
Methoden mogen geen sterke aannames doen over het model (zoals differentieerbaarheid).
Bestaande methoden voor Feature Attribution (FA), zoals Shapley-waarden, werken vaak los van de CE-generatie. Dit leidt tot inconsistente resultaten waarbij de "belangrijkste" kenmerken niet noodzakelijk de meest efficiënte paden naar het doel vertegenwoordigen.

2. Methodologie: Het COLA Framework

De auteurs introduceren COLA (COunterfactuals with Limited Actions), een model- en generator-onafhankelijk post-hoc framework. COLA verfijnt een bestaande counterfactual (gegenereerd door een willekeurig CE-algoritme) om de benodigde wijzigingen te minimaliseren.

Het framework bestaat uit drie hoofdstappen:

A. Optimal Transport (OT) voor Koppeling

In plaats van aan te nemen dat er een vaste 1-op-1 koppeling is tussen feitelijke data ( $x$ ) en gegenereerde counterfactuals ( $r$ ), gebruikt COLA Optimal Transport om een gezamenlijke verdeling (coupling) te vinden.

Dit minimaliseert de kosten van het transporteren van $x$ naar $r$ .
De oplossing van de OT-problematiek levert een koppelingsmatrix $p$ op die de optimale alignatie tussen feitelijke en counterfactual instanties definieert, zelfs als deze niet vooraf bekend is.

B. p-SHAP (Joint Distribution-Informed Shapley Values)

De kerninnovatie is p-SHAP, een nieuwe variant van Shapley-waarden die gebruikmaakt van de door OT gegenereerde koppelingsmatrix $p$ .

Formulering: De waardefunctie $v(S)$ wordt gedefinieerd als het verschil in verwachte modeluitkomst tussen een interventie op een subset van kenmerken $S$ (gebaseerd op de feitelijke waarde) en de onvoorwaardelijke verwachting, waarbij de verdeling $p(r|x)$ wordt gebruikt.
Voordeel: In tegenstelling tot eerdere methoden (zoals CF-SHAP) die een willekeurige of gespecificeerde verdeling gebruiken, gebruikt p-SHAP de optimale transportkoppeling. Dit zorgt ervoor dat de attributie coherent is met de daadwerkelijke paden die nodig zijn om het doel te bereiken.
Theoretisch bewijs: De auteurs bewijzen dat het gebruik van de OT-koppeling een bovengrens minimaliseert op de $W_1$ -divergentie (Wasserstein-afstand) tussen de feitelijke uitkomst en het doel, onder de aanname dat het model Lipschitz-continu is.

C. Selectie van Minimale Acties

Het framework gebruikt de gegenereerde Shapley-waarden om een selectie te maken van welke kenmerken moeten worden gewijzigd:

Bereken Shapley-waarden voor alle kenmerken.
Normaliseer deze waarden tot een waarschijnlijkheidsverdeling.
Selecteer stochastisch een beperkt aantal kenmerken ( $C$ ) om te wijzigen, gebaseerd op deze waarschijnlijkheid.
Pas de waarden aan naar de corresponderende counterfactual waarden (gebaseerd op de OT-koppeling).

3. Belangrijkste Bijdragen

COLA Framework: Het eerste generieke post-hoc framework dat CE's kan verfijnen voor elke combinatie van model en CE-generator, met als doel actie-minimaliteit.
p-SHAP: Een nieuwe attributiemethode die OT-integratie gebruikt om de alignatie tussen feitelijke en counterfactual data te optimaliseren, wat leidt tot betere selectie van kenmerken.
Theoretische Garanties:
- Bewijs dat OT de bovengrens van de $W_1$ -divergentie minimaliseert.
- Bewijs dat de verfijnde counterfactual ( $z$ ) nooit verder van de feitelijke instantie ( $x$ ) verwijderd is dan de oorspronkelijke gegenereerde counterfactual ( $r$ ).
Empirische Prestaties: Uitgebreide validatie over 4 datasets, 12 modellen en 5 verschillende CE-generatoren.

4. Resultaten

De experimenten tonen aan dat COLA met p-SHAP aanzienlijk efficiënter is dan bestaande methoden:

Actie-Reductie: COLA bereikt hetzelfde counterfactual effect (80% tot 100% van het doel) met slechts 26% tot 45% van de oorspronkelijke kenmerkaanpassingen die nodig waren in de ruwe CE. In sommige gevallen (bijv. 80% effect) zelfs slechts 13-25%.
Superioriteit van p-SHAP: Vergelijkingen met andere Shapley-methoden (zoals RB-SHAP, CF-SHAP met uniforme of willekeurige koppelingen) tonen aan dat p-SHAP consistent de beste prestaties levert. Dit bevestigt dat de OT-gebaseerde alignatie cruciaal is en niet alleen het gebruik van counterfactual data.
Near-Optimaliteit: Op een klein schaal-benchmark (waar een Mixed Integer Linear Programming (MILP) oplossing als ground truth kan worden berekend), presteert COLA zeer dicht bij de theoretische optimum.
Robuustheid: De methode werkt goed over verschillende divergentiematen (OT, MMD, MeanD, MedianD) en modeltypes (van lineair tot diepe neurale netwerken).

5. Significantie en Impact

Dit paper biedt een fundamentele verbetering in de praktijk van Explainable AI:

Van "Uitleg" naar "Actie": Het verschuift de focus van het simpelweg uitleggen van een model naar het bieden van haalbare en minimale actieplannen voor gebruikers.
Onafhankelijkheid: Door post-hoc te werken, kan COLA worden toegepast op elk bestaand CE-algoritme, waardoor het een universele "verbeterlaag" biedt.
Theoretische Onderbouwing: Het koppelt het concept van Optimal Transport direct aan Shapley-waarden, wat een nieuwe theoretische basis legt voor het combineren van distributieve analyse en causale attributie.
Ethiek: De auteurs benadrukken dat het verminderen van het aantal wijzigingen ook de kans verkleint dat gebruikers worden aangeraden onmogelijke of ethisch problematische wijzigingen (zoals het veranderen van geslacht of ras) te doen, hoewel ze waarschuwen dat CE's op zichzelf geen garantie voor eerlijkheid bieden.

Conclusie: COLA lost het probleem van "over-moderatie" in counterfactual explanations op door een wiskundig onderbouwde, distributie-informeerde aanpak te gebruiken, waardoor gebruikers heldere, minimale en haalbare adviezen krijgen.