Sufficient, Necessary and Complete Causal Explanations in Image Classification

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ L'Investigatore dell'Immagine: Come capire davvero cosa "vede" un'IA

Immagina di avere un detective robot (l'intelligenza artificiale) che guarda una foto e dice: "Questo è un gatto!".
Spesso, però, non sappiamo perché lo ha detto. Forse ha visto le orecchie? O forse ha visto solo il colore del pelo? O magari ha guardato lo sfondo?

Fino ad ora, gli strumenti per spiegare queste decisioni erano come fotografie sfocate o indizi approssimativi. Dicevano: "Ehi, guarda qui, c'è una macchia verde che sembra importante", ma non potevano essere sicuri al 100% che fosse quella la ragione vera.

In questo articolo, gli autori (David Kelly e Hana Chockler) hanno creato un nuovo metodo, basato sulla causalità, che funziona come un esperimento scientifico perfetto per capire esattamente quali pixel sono essenziali per la decisione dell'IA.

Ecco i concetti chiave, spiegati con metafore semplici:

1. I Tre Tipi di "Indizi" (Spiegazioni)

Gli autori dividono l'immagine in tre categorie di pixel, come se stessero smontando un puzzle:

🟢 I Pixel "Sufficienti" (La Scatola Magica):
Immagina di prendere un'immagine e cancellare tutto tranne un piccolo pezzo. Se l'IA guarda solo quel pezzetto e dice ancora "È un gatto!", allora quel pezzetto è sufficiente. È come se avessi trovato la chiave che apre la serratura: non ti serve altro.
- Nella realtà: Spesso basta pochissimo (pochi pixel) per ingannare l'IA e farle dire la stessa cosa.
🔴 I Pixel "Necessari" (Il Motore Indispensabile):
Ora fai il contrario: prendi l'immagine intera e cancella solo quel pezzo. Se l'IA, guardando il resto, non riesce più a dire "È un gatto" (magari dice "È un cane" o "Non so"), allora quel pezzo era necessario. È come togliere le ruote a un'auto: senza di esse, l'auto non funziona più.
🟡 I Pixel "Completamente Necessari e Sufficienti" (La Verità Pura):
Questo è il "Santo Graal". È il gruppo di pixel che è sia sufficiente sia necessario. Se li prendi tutti insieme, l'IA vede esattamente la stessa cosa che vedeva con l'immagine intera. È la parte dell'immagine che contiene tutta l'informazione utile.

2. Il Concetto di "Fiducia" (Confidence)

Qui entra in gioco la parte più intelligente del paper.
Immagina che l'IA non solo dica "È un gatto", ma aggiunga: "Ne sono sicuro al 90%".

Spiegazione "δ-completa" (La versione "abbastanza buona"):
A volte, per far dire all'IA "È un gatto", non serve la fiducia al 90%. Basta che sia sicura al 50%. Questo paper permette di trovare i pixel necessari per raggiungere qualsiasi livello di fiducia che scegli tu. È come dire: "Dammi la foto che mi fa dire 'è un gatto' anche se sono solo un po' sicuro".
Spiegazione "1-completa" (La versione "perfetta"):
Questa è la più difficile da trovare. Sono i pixel che, se lasciati soli, fanno dire all'IA "È un gatto" con la stessa identica fiducia (es. 90%) che aveva guardando la foto intera. È come se l'IA dicesse: "Non mi serve vedere il resto della stanza, questi pixel mi danno la certezza totale".

3. I Pixel "Regolatori" (Adjustment Pixels)

Cosa succede se togli i pixel necessari e sufficienti, ma l'IA cambia idea o cambia il suo livello di sicurezza?
Gli autori hanno scoperto che ci sono dei pixel "extra" che non servono a decidere se è un gatto o un cane, ma servono a regolare la sicurezza della decisione.

Metafora: Immagina che i pixel "sufficienti" siano il motore dell'auto. I pixel "regolatori" sono il pedale dell'acceleratore. L'auto si muove anche senza premere forte, ma per andare alla velocità giusta (la fiducia originale), devi premere quel pedale. Questi pixel dicono all'IA: "Sì, è un gatto, e sono davvero sicuro al 90%".

4. Perché è rivoluzionario? (La Scatola Nera)

La cosa incredibile è che questo metodo funziona su qualsiasi modello di intelligenza artificiale, anche su quelli che nessuno conosce (le "scatole nere").

Non serve sapere come è fatto il cervello dell'IA.
Non serve accedere ai suoi codici interni.
Non serve che l'IA sia "gentile" o prevedibile (non serve che sia "monotona").

È come se avessi un tester universale che funziona su qualsiasi macchina, senza bisogno di aprire il cofano.

5. Cosa hanno scoperto facendo gli esperimenti?

Hanno testato questo metodo su tre modelli famosi (ResNet50, MobileNet, Swin) e hanno scoperto cose sorprendenti:

Non tutti i cervelli pensano allo stesso modo: Un modello potrebbe aver bisogno di solo il 4% dell'immagine per essere sicuro (molto efficiente), mentre un altro ne ha bisogno del 50% (meno efficiente).
Le "scuse" dell'IA: A volte l'IA guarda cose strane. Ad esempio, in una foto di un'auto, potrebbe guardare solo il cerchione per dire "è un'auto". Se togli il cerchione, dice "è un camion". Questo metodo rivela questi "trucchi" nascosti.

In sintesi

Questo paper ci dà gli strumenti per smontare la decisione di un'IA pixel per pixel.
Non ci dice solo "guarda qui", ma ci dice:

Qual è la parte minima che basta per la decisione?
Qual è la parte indispensabile che non può mancare?
Quali pixel servono solo a rassicurare l'IA sulla sua scelta?

È come passare da una mappa approssimativa a una radiografia precisa del pensiero di un computer, permettendoci di capire se sta ragionando bene o se sta facendo "truccare" la realtà guardando cose sbagliate.

Each language version is independently generated for its own context, not a direct translation.

1. Il Problema

Il campo dell'Explainable AI (XAI) per la classificazione di immagini presenta una dicotomia significativa:

Metodi esistenti: Molti algoritmi attuali (basati su saliency, gradienti o modelli locali come LIME) producono spiegazioni che spesso mancano di rigore formale e non offrono garanzie matematiche sulla causalità delle decisioni del modello.
Approcci logici: Le spiegazioni basate sulla logica (come gli implicants primi o prime implicants) offrono garanzie formali rigorose, ma la loro computabilità dipende da assunzioni restrittive (es. monotonicità o linearità del modello) che raramente si applicano alle reti neurali profonde (black-box) utilizzate per le immagini.
Gap: Manca un framework che unisca il rigore formale delle spiegazioni logiche con la capacità di funzionare su modelli black-box complessi e non monotoni, come le CNN per la classificazione di immagini.

2. Metodologia

Gli autori propongono un framework basato sulla causalità attuale (actual causality) per definire e calcolare spiegazioni per classificatori di immagini.

A. Fondamenti Teorici

Il lavoro si basa sulla definizione di Halpern-Pearl di causa attuale, adattata al contesto della classificazione delle immagini. Viene definito un modello causale binario a due livelli:

Variabili endogene: Un vettore $\vec{V}$ che rappresenta una maschera binaria sui pixel dell'immagine (1 = pixel visibile, 0 = pixel mascherato) e una variabile di output $O$ che indica se la classificazione rimane invariata rispetto all'immagine originale.
Interventi: Il processo di "mascheramento" (sostituire i pixel con un valore predefinito) è modellato come un intervento causale.

B. Nuove Definizioni di Spiegazione

Il paper introduce una tassonomia formale di spiegazioni, estendendo i concetti di sufficienza e necessità:

Spiegazione Sufficiente (SCSE/MCSE): Un sottoinsieme minimo di pixel che, se mantenuti visibili (tutti gli altri mascherati), sono sufficienti a far sì che il modello riproduca la classificazione originale.
Spiegazione Necessaria (NE): Un sottoinsieme di pixel che, se rimossi (mascherati), cambiano la classificazione.
Spiegazione Completa (SCCE/MCCE): Un sottoinsieme di pixel che è sia sufficiente che necessario. Rimuovendo questi pixel, la classificazione cambia; mantenendoli (e mascherando il resto), la classificazione viene mantenuta.
Spiegazioni $\delta$ -confident: Introducono una soglia di confidenza. Una spiegazione è $\delta$ -confident se la probabilità (confidenza) della classificazione sul sottoinsieme di pixel è almeno $\delta \times c$ , dove $c$ è la confidenza originale.
Spiegazioni 1-complete: Un caso speciale di spiegazione completa dove la confidenza della classificazione sul sottoinsieme di pixel è esattamente uguale a quella dell'immagine originale ( $\delta = 1$ ).
Pixel di Adattamento (Adjustment Pixels): I pixel che non fanno parte della spiegazione sufficiente o necessaria, ma che sono richiesti per raggiungere la confidenza originale (1-complete). Questi pixel "aggiustano" la fiducia del modello senza essere strettamente necessari per la decisione binaria.

C. Equivalenza e Complessità

Equivalenza Logica: Gli autori dimostrano che le spiegazioni causali multi-contesto (MCSE) sono formalmente equivalenti alle spiegazioni abductive (prime implicants) della logica, ma senza richiedere che il modello sia monotono.
Complessità: Viene dimostrato che il problema decisionale per trovare queste spiegazioni è co-NP-completo, giustificando l'uso di algoritmi di approssimazione.

D. Algoritmi Proposti

Poiché il calcolo esatto è intrattabile, gli autori implementano algoritmi greedy basati su ReX (un tool esistente per la responsabilità causale):

Algoritmo 1: Calcola spiegazioni $\delta$ -complete ordinando i pixel in base alla loro "responsabilità" causale verso la classificazione. Costruisce due insiemi: uno aggiungendo pixel (per la sufficienza) e uno rimuovendoli (per la necessità).
Algoritmo 2: Identifica i "pixel di adattamento" necessari per trasformare una spiegazione $\delta$ -complete in una 1-complete, aggiungendo o rimuovendo pixel in base alla direzione necessaria per eguagliare la confidenza originale.

3. Risultati Sperimentali

Gli algoritmi sono stati implementati e testati su tre modelli di stato dell'arte (ResNet50, MobileNet, Swin Transformer) e tre dataset (ImageNet-1K, PascalVOC, ECSSD).

Efficienza: Gli algoritmi sono efficienti e totalmente black-box (non richiedono gradienti né accesso interno al modello). Su ResNet50, il tempo medio per calcolare tutti i tipi di spiegazioni è di circa 6 secondi per immagine.
Differenze tra Modelli:
- ResNet50: Richiede il minor numero di pixel per la sufficienza e la completezza, indicando una maggiore efficienza nell'uso delle informazioni visive.
- MobileNet e Swin: Mostrano pattern diversi, con Swin che richiede spiegazioni complete leggermente più grandi.
Analisi dei Pixel di Adattamento: L'analisi dei pixel di adattamento rivela che spesso sono classificati in modo coerente con l'immagine originale ma servono a "raffinare" la confidenza del modello. Ad esempio, in un'immagine di un colobo, i pixel necessari per la classificazione specifica (muso) sono sufficienti, ma i pixel di adattamento (corpo) sono necessari per riportare la confidenza al livello originale.
Confronto con altri XAI: Rispetto a Grad-CAM e LIME, il metodo basato su ReX (causale) produce spiegazioni sufficienti più piccole e precise (in media il 4% dell'immagine contro il 14% di LIME), dimostrando una maggiore stabilità e minore dipendenza dall'architettura del modello.
Distanza Semantica: È stata calcolata la distanza gerarchica tra la classificazione originale e la classificazione "inversa" (ottenuta mascherando i pixel completi). In molti casi, la distanza è piccola (spostamenti di sottocategoria), ma in casi di errori di classificazione (es. un'immagine classificata come "bue" ma con spiegazione inversa "moped"), i pixel di adattamento rivelano comportamenti interessanti del modello.

4. Contributi Chiave

Formalizzazione Causale Rigorosa: Definizione formale di spiegazioni sufficienti, necessarie e complete per classificatori di immagini black-box, dimostrando l'equivalenza con le spiegazioni logiche ma senza vincoli di monotonicità.
Introduzione della Confidenza ( $\delta$ e 1-complete): Estensione del framework causale per includere la confidenza del modello, introducendo il concetto di "pixel di adattamento" che spiegano come il modello raggiunge un certo livello di certezza.
Algoritmi Efficienti e Black-Box: Sviluppo di algoritmi pratici e scalabili che non richiedono accesso ai gradienti o alla struttura interna del modello, rendendoli applicabili a qualsiasi classificatore.
Analisi Empirica Inedita: Prima indagine sistematica sulle differenze di sufficienza e necessità tra diversi architetture di deep learning e sull'analisi dei pixel di adattamento.

5. Significato e Impatto

Questo lavoro colma il divario tra le spiegazioni formali (logiche) e quelle pratiche (causali/black-box) nell'XAI.

Rigore: Fornisce garanzie matematiche sulle spiegazioni, superando l'ambiguità dei metodi basati su gradienti.
Interpretabilità del Modello: La capacità di suddividere un'immagine in pixel sufficienti, necessari e di adattamento offre una nuova lente per comprendere come e con quale certezza un modello prende decisioni, rivelando potenziali fragilità o bias (es. quando il modello si affida a pochi pixel critici ma richiede molti pixel di adattamento per la confidenza).
Applicabilità: Essendo totalmente black-box, il metodo è immediatamente applicabile a qualsiasi sistema di visione artificiale, inclusi quelli critici per la sicurezza o la medicina (es. diagnosi di tumori), dove la comprensione della robustezza della decisione è fondamentale.

In sintesi, il paper stabilisce un nuovo standard per le spiegazioni causali nelle immagini, dimostrando che è possibile ottenere rigore formale e profondità analitica senza sacrificare l'applicabilità a modelli complessi e non trasparenti.