Extended Empirical Validation of the Explainability Solution Space

Dit technische rapport bevestigt de generaliseerbaarheid van het Explainability Solution Space (ESS)-kader door middel van een uitgebreide cross-domein validatie die de oorspronkelijke toepassing op personeelsverloop uitbreidt naar een heterogeen intelligent stedelijk hulpbronnensysteem, waarbij wordt aangetoond dat ESS-rangschikkingen systematisch aanpassen aan governance-rollen en stakeholderconfiguraties in plaats van domeinspecifiek te zijn.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano

Gepubliceerd 2026-03-10
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De "Uitleg-Compass" voor Bankfraude: Een Simpele Uitleg

Stel je voor dat een bank een super-snel, onzichtbaar robot-schildwacht heeft. Deze robot (een AI) kijkt elke seconde naar miljoenen creditcardtransacties en moet binnen 200 milliseconden (sneller dan je kunt knipperen!) beslissen: "Is dit een eerlijke aankoop of is het een dief?"

Als de robot denkt dat het een dief is, blokkeert hij de kaart direct. Maar hier zit het probleem: de robot is een "zwarte doos". Hij weet waarom hij iets blokkeerde, maar hij kan het niet goed uitleggen. En dat is gevaarlijk. Als een klant zijn kaart niet kan gebruiken, wil hij weten waarom. De wet (GDPR en PSD2) zegt ook: "Je mag niet zomaar iemand straffen zonder een goede reden."

Deze rapportage introduceert een nieuw hulpmiddel genaamd ESS (Explainability Solution Space). Denk aan ESS als een multidimensionaal kompas dat helpt bij het kiezen van de juiste manier om de robot zijn gedrag te laten uitleggen.

Het Kompas: Drie Hoofdpijlers

Het kompas heeft drie richtingen waar je naar moet kijken:

  1. De Rechter (Compliance): Moet het bewijs kunnen worden gebruikt in de rechtbank of bij toezichthouders? (Moet het onweerlegbaar zijn?)
  2. De Mens (Gebruiker): Kan de klant of de klantenservice het begrijpen? (Is het duidelijk en actiegericht?)
  3. De Bouwmeester (Ontwikkelaar): Kunnen de programmeurs de robot debuggen als hij gek gaat doen? (Is het technisch inzichtelijk?)

De Vijf Kandidaten voor Uitleg

De auteurs hebben vijf verschillende methoden getest om de robot uit te leggen. Ze vergelijken ze met verschillende soorten vertalers:

  1. SHAP (De Precieze Ingenieur): Deze methode kijkt heel nauwkeurig naar elk detail (zoals het bedrag, de locatie, het tijdstip) en berekent exact hoeveel elk detail heeft bijgedragen aan de beslissing.
    • Sterk punt: Zeer betrouwbaar voor de rechter en de programmeurs.
    • Zwak punt: Kan soms wat technisch klinken voor de gemiddelde klant.
  2. LIME (De Lokale Buurman): Deze methode maakt een simpele, lokale kopie van de beslissing om te zeggen: "In dit specifieke geval zagen we X, Y en Z."
    • Sterk punt: Redelijk begrijpelijk.
    • Zwak punt: Niet altijd 100% accuraat voor de rechtbank.
  3. Counterfactuals (Het "Wat Als"-Spel): Dit is de meest krachtige methode voor de klant. Het zegt: "Je kaart was geblokkeerd. Maar als je bedrag €10 lager was geweest, of als je in je eigen land had gekocht, was je kaart niet geblokkeerd."
    • Sterk punt: Geeft de klant direct een actieplan (hoe kan ik dit voorkomen?).
    • Zwak punt: Moeilijker te bewijzen voor de wet.
  4. Regels (De Grootvader): Deze methode probeert de hele robot om te zetten in simpele "Als-Dan" regels (bijv. "Als bedrag > €5000 EN locatie = vreemd, dan blokkeren").
    • Sterk punt: Perfect voor de rechter, heel duidelijk.
    • Zwak punt: Te traag om in real-time te gebruiken en vaak te simpel voor complexe situaties.
  5. Voorbeelden (De Spiegel): Deze methode zegt: "We hebben je transactie vergeleken met 5 andere bekende fraudegevallen die er precies op leken."
    • Sterk punt: Menselijk en intuïtief.
    • Zwak punt: Moeilijk te gebruiken voor juridische bewijslast.

De Grote Uitdaging: Snelheid vs. Kwaliteit

In de fraude-detectie is tijd alles. Je hebt maar 200 milliseconden.

  • Als je te veel tijd steekt in een perfecte uitleg, is de transactie al te laat en blokkeert het systeem niet meer.
  • Als je te snel bent, krijg je een slechte uitleg die de klant niet begrijpt of die de rechter afwijst.

De Oplossing: Een Slimme Mix (Hybride Strategie)

De auteurs concluderen dat er geen enkele methode is die alles perfect doet. In plaats daarvan kiezen ze voor een drie-laags strategie, net als een ziekenhuis met een spoedeisende hulp, een polikliniek en een archief:

  1. Laag 1: De Spoedhulp (Altijd aan): Voor elke transactie die wordt beoordeeld, gebruikt het systeem SHAP.
    • Waarom? Het is snel genoeg (<50ms), technisch perfect voor de programmeurs en juridisch sterk genoeg voor de bank. Het is de "standaard" uitleg.
  2. Laag 2: De Polikliniek (Alleen bij problemen): Als een klant in beroep gaat of een klantenservice-medewerker een blokkering moet controleren, wordt Counterfactuals gebruikt.
    • Waarom? Hier is snelheid minder belangrijk dan duidelijkheid. De klant wil weten: "Wat moet ik doen om dit te voorkomen?" Dit antwoord is hier het beste.
  3. Laag 3: Het Archief (Wekelijks): Een keer per week draaien ze Regels (Rule Extraction).
    • Waarom? Dit is te traag voor live gebruik, maar perfect om de hele robot te controleren en een rapport te maken voor de toezichthouder. "Zo werkt onze robot in het algemeen."

Conclusie

Deze studie bewijst dat je niet één "magische oplossing" zoekt voor AI. Je moet een mix kiezen die past bij de situatie.

  • Voor de snelheid en techniek: SHAP.
  • Voor de klant en actie: Counterfactuals.
  • Voor de wet en globale controle: Regels.

Door deze slimme mix te gebruiken, kan de bank snel fraudes stoppen, maar ook eerlijk en duidelijk uitleggen waarom, zodat zowel de klant als de wet tevreden zijn. Het is alsof je een team hebt: de ene doet het snelle werk, de andere de uitleg, en de derde houdt het grootboek bij.