Causal Identification from Counterfactual Data: Completeness and Bounding Results

Each language version is independently generated for its own context, not a direct translation.

Il Mistero del "Cosa Sarebbe Succeso": Come l'IA sta imparando a viaggiare nel tempo (quasi)

Immagina di essere un detective che deve risolvere un caso. Hai due tipi di prove:

Cosa è successo davvero (le foto della scena del crimine).
Cosa sarebbe successo se avessi fatto una cosa diversa (es. "Se il sospetto non avesse indossato il cappello rosso, sarebbe stato arrestato?").

Fino a poco tempo fa, gli scienziati pensavano che la seconda prova fosse impossibile da ottenere. Potevi solo guardare le foto (dati osservativi) o fare esperimenti controllati (es. "Facciamo indossare il cappello rosso a 100 persone a caso e vediamo cosa succede"). Ma non potevi mai sapere cosa sarebbe successo allo stesso individuo in un mondo alternativo.

Questo paper di Arvind Raghavan ed Elias Bareinboim cambia le regole del gioco. Ecco come, spiegato con delle metafore.

1. Il Livello 3: La Sfida del "Viaggio nel Tempo"

Immagina la conoscenza causale come una scala a tre gradini (la Gerarchia Causale di Pearl):

Gradino 1 (Guardare): "Chi prende multe?" (Osservazione).
Gradino 2 (Fare): "Cosa succede se cambiamo il colore dell'auto?" (Esperimento).
Gradino 3 (Immaginare): "Cosa sarebbe successo a Mario (che guidava un'auto rossa) se avesse guidato un'auto blu, mentre tutto il resto fosse rimasto uguale?"

Fino a ieri, pensavamo che il Gradino 3 fosse un mondo magico inaccessibile. Non potevamo raccogliere dati su "cosa sarebbe successo" perché non possiamo viaggiare nel tempo.

2. La Grande Scoperta: Il "Teletrasporto Parziale"

Gli autori di un lavoro precedente (Raghavan & Bareinboim, 2025) hanno scoperto un trucco geniale. Immagina di avere una telecamera di sicurezza che riprende un'auto rossa.

Intervento normale (Gradino 2): Sostituisci l'auto rossa con una blu. Ma così cambi anche il modo in cui gli altri guidano (magari la gente si spaventa di più con la blu).
Intervento "Controfattuale" (Gradino 3): Usi un filtro digitale sulla telecamera. Cambi il colore dell'auto solo per l'algoritmo che decide la multa, ma lasci tutto il resto com'è. La gente continua a guidare come se fosse un'auto rossa, ma l'IA vede un'auto blu.

Questo si chiama Realizzabilità Controfattuale. Significa che, in certi casi, possiamo raccogliere dati sul "mondo alternativo" direttamente dal mondo reale, senza bisogno di macchine del tempo.

3. L'Algoritmo CTFIDU+: Il Detective Infalibile

Ora che abbiamo questi nuovi dati "magici" (Gradino 3), sorge una domanda: Possiamo rispondere a TUTTE le domande sul "cosa sarebbe successo"?

Gli autori hanno creato un nuovo algoritmo chiamato CTFIDU+.

Cosa fa: È come un detective super-intelligente che prende i dati che hai (osservazioni, esperimenti e questi nuovi dati "teletrasportati") e cerca di calcolare la risposta alla tua domanda.
La sua promessa: Se la risposta esiste ed è calcolabile con i dati che hai, CTFIDU+ la troverà. Se dice "FAIL" (fallito), allora è matematicamente impossibile rispondere, non importa quanto sei bravo. È completo: non lascia nulla di intentato.

4. Il Limite Fondamentale: Non tutto è risolvibile

C'è però un limite. Anche con questi nuovi dati, ci sono domande che rimangono irrisolvibili.
Immagina di voler sapere: "Se avessi mangiato la mela rossa, saresti stato avvelenato, anche se in realtà hai mangiato la verde?"
Se ci sono fattori nascosti (come un veleno invisibile che agisce su entrambe le mele) che non puoi controllare nemmeno con il "teletrasporto", allora la risposta è impossibile da trovare con certezza.

Il paper dimostra che il limite di ciò che possiamo immaginare (identificare) è esattamente lo stesso limite di ciò che possiamo osservare con i nostri nuovi esperimenti speciali. Se non puoi "realizzarlo" fisicamente con il trucco del teletrasporto, non puoi nemmeno "identificarlo" matematicamente.

5. Quando non puoi avere la risposta esatta: I "Confini"

E se la domanda è impossibile da rispondere con un numero esatto? Non buttiamo la spugna!
Gli autori dicono: "Ok, non possiamo sapere il numero esatto, ma possiamo restringere il campo".

Senza i nuovi dati: "La probabilità che tu sia stato avvelenato è tra lo 0% e il 100%". (Inutile).
Con i nuovi dati: "La probabilità è tra il 40% e il 60%". (Molto meglio!).

Hanno creato delle nuove formule matematiche che usano questi dati speciali per stringere i confini della risposta. È come se prima avessi un cerchio enorme che copre tutta la città, e ora, grazie ai nuovi dati, hai un cerchio piccolo che copre solo un quartiere.

Esempio Pratico: La Macchina del Traffico

Pensa a un'IA che decide chi multare per eccesso di velocità basandosi sui video.

Problema: L'IA è razzista? Multa di più le auto rosse perché i dati di addestramento mostrano che chi guida auto rosse tende a correre di più?
Soluzione: Con i vecchi metodi, non potevamo separare il colore dell'auto dalla velocità reale.
Nuovo metodo: Usiamo il "teletrasporto" (ctf-rand). Mostriamo all'IA un'auto rossa che in realtà è blu (o viceversa), ma lasciamo che la velocità sia quella reale.
Risultato: Possiamo ora calcolare esattamente quanto l'IA sia ingiusta verso il colore dell'auto, o almeno restringere l'errore a un margine molto piccolo.

In Sintesi

Questo paper ci dice:

Abbiamo nuovi poteri: Possiamo raccogliere dati su mondi alternativi usando trucchi sperimentali intelligenti.
Abbiamo un nuovo detective: L'algoritmo CTFIDU+ sa usare questi dati per rispondere a domande che prima erano impossibili.
C'è un limite: Non possiamo rispondere a tutto, ma sappiamo esattamente dove finisce la nostra conoscenza.
Anche se non sappiamo tutto, sappiamo di più: Anche per le domande irrisolvibili, questi nuovi dati ci danno risposte molto più precise e utili di prima.

È un passo avanti enorme per rendere l'Intelligenza Artificiale più giusta, spiegabile e capace di capire le conseguenze delle nostre azioni, anche quelle che non abbiamo mai compiuto.

Each language version is independently generated for its own context, not a direct translation.

1. Il Problema

La gerarchia causale di Pearl (PCH) distingue tre livelli di ragionamento: osservazionale (Livello 1), interventale (Livello 2) e controfattuale (Livello 3). Storicamente, l'identificazione delle query controfattuali (es. $P(Y_x = y | X = x')$ ) è stata limitata all'uso di dati osservazionali o interventali (Livelli 1 e 2), poiché si presumeva che i dati distribuiti a Livello 3 fossero inaccessibili se non indirettamente tramite identificazione.

Tuttavia, lavori recenti hanno introdotto il concetto di realizzabilità controfattuale (counterfactual realizability), dimostrando che è possibile raccogliere dati direttamente dal Livello 3 attraverso procedure sperimentali chiamate counterfactual randomization (ctf-rand). Queste procedure permettono di manipolare la percezione di una variabile da parte dei suoi figli senza alterarne il valore naturale o influenzare altre variabili.

Il problema centrale affrontato in questo lavoro è: quali quantità controfattuali diventano identificabili quando abbiamo accesso a un insieme arbitrario di distribuzioni del Livello 3 (inclusi i dati realizzabili)? Inoltre, quali sono i limiti fondamentali dell'inferenza causale esatta in questo nuovo contesto, e come possiamo gestire le quantità non identificabili?

2. Metodologia

Gli autori sviluppano un approccio sistematico basato su tre pilastri metodologici:

Algoritmo CTFIDU+: Viene proposto un nuovo algoritmo, CTFIDU+, progettato per identificare query controfattuali partendo da un insieme arbitrario di distribuzioni di input (che possono includere dati osservazionali, interventali e controfattuali realizzabili). L'algoritmo si basa su una decomposizione della query in "fattori controfattuali" (ctf-factors) e utilizza una subroutine chiamata IDENTIFY+.
Nuova Struttura Dati (Ctf-Hedge): Per dimostrare la completezza, gli autori introducono una nuova struttura dati chiamata ctf-hedge (siepe controfattuale). Questa struttura generalizza i concetti precedenti di "hedge" e "thicket" usati per dimostrare la non-identificabilità. Se l'algoritmo rileva una ctf-hedge, fornisce una prova formale che la query non è identificabile dai dati di input.
Teoria della Realizzabilità e Limiti: Gli autori analizzano la relazione tra l'identificabilità e la realizzabilità fisica. Introducono una segmentazione fine della gerarchia di Pearl, definendo i livelli L2.25 e L2.5, dove L2.5 rappresenta l'insieme delle distribuzioni controfattuali che possono essere campionate fisicamente tramite azioni ctf-rand.

3. Contributi Chiave

A. Completezza dell'Identificazione (Sezione 3)

CTFIDU+ è Completo: Viene dimostrato che l'algoritmo CTFIDU+ è completo per l'identificazione di query controfattuali (Livello 3) quando si dispone di dati realizzabili. Se la query è identificabile, l'algoritmo restituisce un'espressione unica in termini dei dati di input; altrimenti, restituisce "FAIL".
Generalizzazione: Questo risultato subsume gli algoritmi precedenti (come IDC*, PSIDC, CTFID) che erano limitati all'uso esclusivo di dati del Livello 2.
Identify+: La subroutine IDENTIFY+ è dimostrata essere completa per l'identificazione di un fattore controfattuale target da un fattore controfattuale di input, rilevando le ctf-hedge come certificati di non-identificabilità.

B. Limiti Fondamentali e Dualità (Sezione 4)

Limite Teorico (Teorema 4.1): Gli autori provano che nel setting non parametrico, nessuna quantità puramente del Livello 3 (L3 \ L2.5) è identificabile, anche disponendo di tutti i dati realizzabili possibili (L2.5). Esiste un limite fondamentale: le distribuzioni che non possono essere campionate fisicamente (non realizzabili) non possono essere identificate esattamente da dati di livelli inferiori o realizzabili.
Dualità Identificabilità-Realizzabilità (Corollario 4.2): Viene stabilita una dualità fondamentale: una query è identificabile dai dati sperimentali e osservazionali se e solo se è, in principio, realizzabile tramite azioni di ctf-rand. Questo collega direttamente la capacità di raccogliere dati alla capacità di inferirli.

C. Identificazione Parziale e Stretti (Sezione 5)

Miglioramento dei Limiti: Anche per le quantità non identificabili (come l'Effetto Totale Naturale - NTE), l'accesso ai dati controfattuali realizzabili (L2.5) permette di derivare limiti analitici più stretti rispetto a quelli ottenibili con soli dati osservazionali o interventali (L1/L2).
Nuovi Legami Analitici: Vengono derivati nuovi limiti per le probabilità di causalità (es. $P(y_x | x', y')$ ) utilizzando dati controfattuali, dimostrando che l'intervallo di credibilità si restringe significativamente.
Validazione Empirica: Simulazioni su scenari reali (es. audit di fairness per telecamere del traffico e selezione di unità per programmi di disintossicazione) confermano che l'uso di dati L2.5 riduce drasticamente l'incertezza e, in alcuni casi, permette di identificare esattamente quantità che prima erano solo parzialmente identificabili.

4. Risultati Principali

Algoritmo Completo: CTFIDU+ risolve il problema dell'identificazione controfattuale in presenza di dati di Livello 3, fornendo un metodo sistematico e completo.
Impossibilità Assoluta: È dimostrato che non è possibile identificare esattamente quantità controfattuali che non sono fisicamente realizzabili (fuori da L2.5), indipendentemente dalla quantità di dati sperimentali disponibili. Questo definisce il limite teorico dell'inferenza causale non parametrica.
Valore dei Dati Controfattuali: L'accesso ai dati realizzabili (L2.5) non solo permette l'identificazione esatta di nuove classi di query (come l'Effetto Diretto Naturale - NDE), ma riduce anche l'intervallo di incertezza per le query non identificabili, offrendo stime più precise per decisioni critiche (es. equità algoritmica, spiegabilità AI).

5. Significato e Impatto

Questo lavoro rappresenta un avanzamento fondamentale nella teoria dell'inferenza causale:

Superamento del Dogma: Sfida l'assunzione tradizionale secondo cui i dati controfattuali sono inaccessibili, mostrando come possano essere raccolti sperimentalmente e utilizzati.
Mappatura dei Limiti: Definisce chiaramente cosa è possibile e cosa non è possibile inferire causalmente senza assumere modelli parametrici, delimitando la regione L2.5 come il confine massimo dell'inferenza esatta.
Applicazioni Pratiche: Offre strumenti concreti per l'analisi della fairness, l'AI spiegabile (XAI) e la decisione personalizzata, permettendo di ottenere stime più robuste e meno ambigue per le politiche pubbliche e i sistemi di IA.
Progettazione Sperimentale: Suggerisce che la progettazione di esperimenti dovrebbe mirare a raccogliere dati realizzabili (L2.5) per massimizzare l'identificabilità e ridurre l'incertezza, anche quando l'identificazione esatta non è possibile.

In sintesi, il paper fornisce sia la "mappa" (l'algoritmo CTFIDU+) per navigare l'identificazione controfattuale con nuovi dati, sia i "confini" (i teoremi sui limiti di L2.5) che definiscono la frontiera ultima della conoscenza causale in assenza di assunzioni parametriche.