Causal Identification from Counterfactual Data: Completeness and Bounding Results

Cet article propose l'algorithme CTFIDU+ pour prouver la complétude de l'identification des requêtes contrefactuelles à partir de distributions de niveau 3 réalisables, établit les limites théoriques de l'inférence causale non paramétrique et dérive de nouvelles bornes analytiques pour les quantités non identifiables.

Arvind Raghavan, Elias Bareinboim

Publié 2026-03-05
📖 6 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Le Contexte : Les Trois Niveaux de la Réalité

Imaginez que la compréhension du monde se divise en trois étages, comme un immeuble :

  1. Le Rez-de-chaussée (Observer) : C'est ce que nous voyons naturellement. Par exemple, « Les voitures rouges reçoivent plus d'amendes ». C'est de la simple observation.
  2. Le Premier Étage (Agir) : C'est ce qui se passe si nous intervenons. Par exemple, « Si nous forçons toutes les voitures à être rouges (via une expérience), combien recevront une amende ? ». C'est ce qu'on appelle une intervention.
  3. Le Deuxième Sous-sol (Imaginer / Contrefactuel) : C'est le niveau le plus mystérieux. C'est la question du regret ou de l'alternative : « Cette voiture rouge a reçu une amende. Mais et si elle avait été bleue à ce moment précis, aurait-elle eu une amende ? ».

Jusqu'à présent, les scientifiques pensaient que le Deuxième Sous-sol était inaccessible. On ne pouvait pas revenir en arrière pour changer la couleur de la voiture dans le passé. On ne pouvait donc pas répondre à ces questions « Et si ? » avec certitude, seulement avec des suppositions.

La Nouvelle Découverte : La « Réalité Contrefactuelle »

C'est là que ce papier apporte une révolution. Les auteurs (Raghavan et Bareinboim) disent : « Attendez, on peut en fait accéder à ce niveau ! »

Ils ont découvert une méthode expérimentale appelée « randomisation contrefactuelle ».

  • L'analogie du film : Imaginez que vous regardez un film où un acteur porte un manteau rouge. Vous ne pouvez pas changer l'acteur dans le passé. Mais, imaginez que vous avez un écran vert (un green screen) sur le manteau. Vous pouvez projeter une image de manteau bleu uniquement sur l'écran que voit le policier qui donne l'amende, sans changer la réalité de l'acteur ni celle des autres passants.
  • En science, cela signifie qu'on peut manipuler la perception d'une cause (la couleur de la voiture) pour un effet spécifique (la décision de l'IA), sans altérer le reste de la chaîne causale. Cela permet de collecter des données sur des mondes parallèles réels.

Les Trois Contributions Clés du Papier

Voici ce que les auteurs ont fait avec cette nouvelle capacité, expliqué simplement :

1. La Carte au Trésor (L'Algorithme CTFIDU+)

Avant, on avait des cartes pour trouver des trésors (répondre à des questions) en utilisant seulement le rez-de-chaussée et le premier étage. Maintenant, on a accès au sous-sol.
Les auteurs ont créé un nouvel algorithme, CTFIDU+, qui est comme un GPS ultime.

  • Ce qu'il fait : Il prend n'importe quelle question « Et si ? » et vérifie si, avec nos nouvelles données (y compris celles du sous-sol), on peut trouver la réponse exacte.
  • La promesse : Si la réponse est mathématiquement possible, cet algorithme la trouvera. S'il dit « Non, impossible », alors c'est vraiment impossible, peu importe combien on cherche. C'est une garantie de complétude.

2. La Limite de l'Imagination (La Dualité)

Le papier pose une question fondamentale : « Est-ce que tout ce qu'on peut imaginer est calculable ? »
La réponse est non.

  • L'analogie : Imaginez que vous essayez de reconstruire un château de cartes. Même si vous avez des cartes supplémentaires (les données contrefactuelles), il y a certaines structures de châteaux qui sont physiquement impossibles à construire sans que les cartes ne s'effondrent.
  • Les auteurs prouvent qu'il existe une frontière stricte. Si une question « Et si ? » est trop complexe (trop de contradictions dans la logique du monde), même avec nos nouvelles expériences, on ne pourra jamais la répondre avec certitude. C'est une limite fondamentale de la connaissance humaine dans un monde non-paramétrique (un monde où on ne fait pas de suppositions simplistes sur la nature).

3. Même si on ne peut pas tout savoir, on peut mieux deviner (Les Bornes)

Parfois, on ne peut pas obtenir la réponse exacte (par exemple, « Quelle est la probabilité exacte ? »). Mais on peut souvent obtenir une fourchette (par exemple, « La probabilité est entre 20% et 80% »).

  • Le problème : Avec les anciennes méthodes (observation + intervention), cette fourchette était souvent très large, comme dire « Il fera entre -20°C et +40°C demain ». Pas très utile !
  • La solution : En utilisant les nouvelles données contrefactuelles, les auteurs montrent qu'on peut resserrer cette fourchette.
  • L'analogie : C'est comme si vous cherchiez un objet perdu dans une pièce sombre. Avant, vous saviez juste qu'il était « quelque part dans la maison ». Avec les nouvelles données, vous pouvez dire « Il est probablement dans le salon, entre le canapé et la table ». C'est beaucoup plus précis, même si vous ne l'avez pas encore trouvé exactement.

Pourquoi est-ce important pour nous ?

Ces recherches ne sont pas juste de la théorie abstraite. Elles touchent à des sujets cruciaux de notre vie :

  • L'Équité (Fairness) : Si une IA refuse un prêt à une personne, on peut maintenant mieux comprendre si c'est à cause de son origine (la couleur de la voiture) ou de ses revenus, en simulant des scénarios « Et si elle avait eu un profil différent ? ».
  • L'Explication (XAI) : On peut expliquer pourquoi une décision a été prise en comparant la réalité avec ce qui aurait pu se passer.
  • La Médecine : On peut mieux estimer l'efficacité d'un traitement pour un patient spécifique en comparant son état réel avec un état contrefactuel.

En Résumé

Ce papier dit essentiellement : « Nous avons trouvé un moyen de voir dans des mondes parallèles réels. Nous avons créé un outil pour savoir si nous pouvons répondre à n'importe quelle question sur ces mondes. Et même si nous ne pouvons pas tout savoir avec certitude, nous pouvons maintenant faire des prédictions beaucoup plus précises et utiles qu'avant. »

C'est une avancée majeure qui transforme la philosophie du « Et si ? » en une science pratique et calculable.