Towards plausibility in time series counterfactual explanations

Each language version is independently generated for its own context, not a direct translation.

Voici une explication de ce papier de recherche, imagée et simplifiée pour le grand public, comme si nous discutions autour d'un café.

🕵️‍♂️ Le Problème : Le "Pourquoi" mystérieux des machines

Imaginez que vous êtes un médecin ou un banquier. Vous utilisez une intelligence artificielle (IA) très intelligente pour analyser des courbes (comme un électrocardiogramme ou l'historique de vos dépenses). L'IA vous dit : "Non, ce patient est en bonne santé" ou "Non, cette transaction est sûre".

Mais vous vous demandez : "Et si j'avais fait un petit changement ici, l'IA aurait-elle dit 'Oui' ?"

C'est ce qu'on appelle une explication contrefactuelle. C'est comme dire : "Si tu avais mangé moins de sucre, tu serais en bonne santé". C'est une réponse très utile car elle vous dit quoi faire pour changer le résultat.

⚠️ Le Piège : Les fausses réponses

Le problème, c'est que les méthodes actuelles pour créer ces "scénarios alternatifs" sont souvent trop brutales. Elles modifient les données de manière mathématique, mais irréaliste.

L'analogie du dessin :
Imaginez que vous avez un dessin d'un chat (le patient malade). L'IA vous dit : "Pour que ce dessin devienne un chien, il faut changer quelques pixels".

Les anciennes méthodes pourraient prendre votre chat et lui coller un nez de chien, des oreilles de chien, mais en gardant le corps du chat. Le résultat ressemble à un monstre étrange, un "chat-chien" qui n'existe pas dans la nature. C'est mathématiquement juste, mais plausible ? Non. C'est comme si on vous disait : "Pour gagner au loto, il faut que vous ayez 3 bras". Techniquement possible dans un univers parallèle, mais pas dans la réalité.

💡 La Solution : La méthode "Soft-DTW" des auteurs

Marcin, Krzysztof et Maciej (les auteurs) ont créé une nouvelle méthode pour générer ces explications. Leur but ? Que le "chat-chien" ressemble vraiment à un chien qui existe dans la vraie vie.

Voici comment ils font, avec une analogie simple :

1. Le "Calque" Temporel (Le Soft-DTW)

Les données temporelles (comme un rythme cardiaque) ne sont pas juste une liste de chiffres. C'est une danse dans le temps. Parfois, un battement de cœur est un peu plus rapide, parfois un peu plus lent, mais la forme de la danse reste la même.

Les anciennes méthodes regardaient point par point (le chiffre 10 à la seconde 1, le chiffre 12 à la seconde 2). Si le rythme décale de 1 seconde, elles pensent que c'est une erreur.

Les auteurs utilisent une technique appelée Soft-DTW.

L'image : Imaginez que vous avez un dessin de chien (la classe cible) et votre dessin de chat (votre cas actuel). Au lieu de les superposer parfaitement et de dire "ceci ne correspond pas", vous utilisez un calque élastique. Vous pouvez étirer ou comprimer légèrement le temps pour que les formes s'alignent parfaitement, même si l'un est un peu plus rapide que l'autre.

2. Le "Groupe de Copains" (Les k-plus proches voisins)

Pour s'assurer que leur nouveau dessin ressemble vraiment à un chien, ils ne devinent pas au hasard. Ils regardent un groupe de vrais chiens (les données d'entraînement de la classe "chien").

Le processus : Ils prennent leur "chat modifié" et demandent : "Est-ce que ce dessin ressemble à l'un de nos vrais chiens ?". Si ce n'est pas le cas, ils ajustent le dessin jusqu'à ce qu'il soit indistinguable d'un vrai chien, tout en restant proche du chat original.

🏆 Les Résultats : Un compromis intelligent

En testant leur méthode sur de vraies données (comme des ECG ou des données industrielles), ils ont découvert quelque chose d'intéressant :

Les anciennes méthodes faisaient de très petits changements (très proches de l'original), mais le résultat final était souvent bizarre ou ne fonctionnait pas vraiment (l'IA ne changeait pas d'avis).
La nouvelle méthode fait des changements un peu plus grands (elle modifie plus de pixels), mais le résultat est parfaitement réaliste.

L'analogie finale :
Si vous voulez transformer une voiture en camion :

La vieille méthode vous dit : "Enlève juste deux roues". Résultat : une voiture qui ne roule plus.
La nouvelle méthode dit : "Voici comment on transforme la voiture en camion : on allonge le châssis, on ajoute un coffre, on renforce les pneus". C'est un changement plus important, mais le résultat est un véhicule fonctionnel et réaliste.

🎯 En résumé

Ce papier nous apprend que pour expliquer une décision d'IA sur des données qui évoluent dans le temps (comme la santé ou la finance), il ne suffit pas de faire le minimum de changement mathématique. Il faut que le changement ressemble à la réalité.

Leur méthode utilise une sorte de "magnétisme temporel" pour attirer la réponse vers des exemples réels et cohérents, garantissant que les explications données aux humains sont non seulement justes, mais aussi crédibles et utiles.

Each language version is independently generated for its own context, not a direct translation.

Voici un résumé technique détaillé de l'article « Towards plausibility in time series counterfactual explanations » en français.

1. Problématique

L'explicabilité des modèles d'intelligence artificielle (XAI) est cruciale dans les domaines à haut risque (santé, finance, industrie). Les explications contrefactuelles (CFE) répondent à la question : « Quelles modifications minimales de l'entrée changeraient la prédiction du modèle ? ».

Bien que des méthodes existent pour les données tabulaires, leur application aux séries temporelles pose un défi majeur : la plausibilité.

Le problème : Les méthodes actuelles génèrent souvent des contre-factuels qui, bien que valides (ils changent la classe prédite), sont irréalistes. Ils peuvent présenter des structures temporelles incohérentes, des discontinuités brutales ou ressembler à des perturbations adverses, ce qui nuit à la confiance de l'utilisateur.
L'objectif : Développer une méthode capable de générer des contre-factuels pour des séries temporelles qui soient non seulement valides, mais aussi plausibles, c'est-à-dire alignés avec la distribution réelle des données de la classe cible et respectant la dynamique temporelle sous-jacente.

2. Méthodologie

Les auteurs proposent une nouvelle approche basée sur l'optimisation par gradient directement dans l'espace d'entrée. Contrairement aux méthodes qui opèrent dans un espace latent (via des autoencodeurs) ou qui substituent des segments de données existants, cette méthode modifie itérativement la série temporelle d'origine.

Fonctionnement de l'optimisation

L'objectif est de minimiser une fonction de perte multi-composantes ( $L_{CF}$ ) pour transformer une série $X$ (classe originale $\hat{y}$ ) en une série $X'$ (classe cible $y_{target}$ ) :

$L_{CF} = L_{prox} + L_{sparse} + \lambda \cdot (L_{valid} + L_{DTW})$

Les composantes clés sont :

Proximité ( $L_{prox}$ ) : Mesurée par la distance euclidienne au carré ( $L_2$ ), elle assure que le contre-factuel reste proche de l'instance originale.
Sparsité ( $L_{sparse}$ ) : Mesurée par la norme $L_1$ , elle encourage des modifications localisées plutôt que globales.
Validité ( $L_{valid}$ ) : Utilise une perte de type hinge pour garantir que le classificateur prédit la classe cible avec une probabilité supérieure à un seuil $\tau$ .
Plausibilité ( $L_{DTW}$ ) - Contribution Centrale :
- C'est le cœur de l'innovation. Pour garantir que la structure temporelle est réaliste, la méthode aligne le contre-factuel généré $X'$ avec les $k$ plus proches voisins de la classe cible.
- Soft-DTW : L'auteur utilise la distance Soft-DTW (Dynamic Time Warping différentiable) au lieu de la DTW classique (non différentiable). La Soft-DTW remplace le minimum dur par un opérateur soft-minimum lisse, permettant le calcul de gradients.
- Cette perte force le contre-factuel à adopter les motifs temporels caractéristiques des échantillons réels de la classe cible, évitant ainsi les artefacts adverses.

3. Contributions Clés

Méthode d'optimisation directe : Une approche nouvelle pour les CFE de séries temporelles qui optimise directement dans l'espace des entrées tout en intégrant une contrainte de plausibilité explicite via la Soft-DTW.
Alignement avec la distribution cible : L'intégration d'une perte basée sur la distance aux $k$ -plus proches voisins de la classe cible assure que les contre-factuels respectent la dynamique temporelle réelle, et non seulement la géométrie de l'espace latent.
Évaluation complète : Une comparaison rigoureuse contre des méthodes de référence solides (Glacier, M-CELS) sur plusieurs jeux de données (UCI/UEA), évaluant la validité, la sparsité, la proximité et la plausibilité.
Analyse qualitative et quantitative : Démonstration que les méthodes existantes échouent souvent à préserver la structure temporelle, produisant des résultats valides mais irréalistes.

4. Résultats Expérimentaux

Les expériences ont été menées sur 8 jeux de données (univariés et multivariés) avec un classificateur CNN 1D.

Validité : La méthode proposée atteint une validité quasi parfaite (souvent 100 %), surpassant nettement les méthodes de référence (Glacier et M-CELS) qui obtiennent des taux de succès beaucoup plus faibles (parfois < 50 %).
Plausibilité (Score DTW) : C'est le résultat le plus significatif. La méthode proposée obtient des distances DTW vers les voisins de la classe cible plus faibles d'un ordre de grandeur par rapport aux concurrents.
- Exemple : Sur le jeu de données TwoLeadECG, la distance DTW est de 0,016 contre 0,064 pour Glacier et 0,302 pour M-CELS.
- Le score Isolation Forest (mesurant si l'instance est considérée comme un point normal ou une anomalie) est également excellent (1,000 sur la plupart des jeux de données).
Proximité et Sparsité : Il existe un compromis (trade-off). La méthode proposée génère des contre-factuels avec des distances $L_1$ et $L_2$ plus élevées que les méthodes de référence. Cela signifie que pour obtenir une plausibilité temporelle réaliste, des modifications plus importantes sont nécessaires, mais elles sont structurellement cohérentes.
Analyse Qualitative : Les visualisations montrent que les méthodes concurrentes produisent souvent des perturbations subtiles mais inadéquates ou des motifs "adverses", tandis que la méthode proposée transforme la série en respectant les formes géométriques caractéristiques de la classe cible (ex: formes de cylindre, cloche ou entonnoir sur le jeu CBF).

5. Signification et Limites

Signification :
Ce travail démontre que pour les séries temporelles, la validité seule ne suffit pas. Une explication contrefactuelle doit être temporellement cohérente. En forçant l'alignement avec la distribution des données réelles via la Soft-DTW, la méthode produit des explications actionnables et dignes de confiance, essentielles pour des domaines comme la médecine ou la finance.

Limites :

Complexité computationnelle : Le calcul de la Soft-DTW est quadratique par rapport à la longueur de la série. L'ajout de l'alignement avec $k$ voisins à chaque itération rend la méthode coûteuse pour les séries très longues.
Hypothèse de distribution : La méthode suppose que les $k$ -plus proches voisins représentent bien la classe cible. Si la classe possède une distribution multimodale complexe (plusieurs types de motifs temporels distincts), l'alignement forcé sur un seul voisin peut limiter la diversité des contre-factuels générés.

Perspectives futures :
Les auteurs suggèrent l'utilisation de modèles génératifs probabilistes pour mieux modéliser la densité des séries temporelles et capturer la diversité des motifs au sein d'une même classe, dépassant ainsi la limitation de l'alignement sur les $k$ -plus proches voisins.