Towards plausibility in time series counterfactual explanations

Cet article présente une nouvelle méthode d'optimisation par gradient pour générer des explications contrefactuelles plausibles en classification de séries temporelles, en intégrant une contrainte d'alignement soft-DTW avec les voisins les plus proches pour garantir une structure temporelle réaliste tout en surpassant les approches existantes.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba

Publié Tue, 10 Ma
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Voici une explication de ce papier de recherche, imagée et simplifiée pour le grand public, comme si nous discutions autour d'un café.

🕵️‍♂️ Le Problème : Le "Pourquoi" mystérieux des machines

Imaginez que vous êtes un médecin ou un banquier. Vous utilisez une intelligence artificielle (IA) très intelligente pour analyser des courbes (comme un électrocardiogramme ou l'historique de vos dépenses). L'IA vous dit : "Non, ce patient est en bonne santé" ou "Non, cette transaction est sûre".

Mais vous vous demandez : "Et si j'avais fait un petit changement ici, l'IA aurait-elle dit 'Oui' ?"

C'est ce qu'on appelle une explication contrefactuelle. C'est comme dire : "Si tu avais mangé moins de sucre, tu serais en bonne santé". C'est une réponse très utile car elle vous dit quoi faire pour changer le résultat.

⚠️ Le Piège : Les fausses réponses

Le problème, c'est que les méthodes actuelles pour créer ces "scénarios alternatifs" sont souvent trop brutales. Elles modifient les données de manière mathématique, mais irréaliste.

L'analogie du dessin :
Imaginez que vous avez un dessin d'un chat (le patient malade). L'IA vous dit : "Pour que ce dessin devienne un chien, il faut changer quelques pixels".

  • Les anciennes méthodes pourraient prendre votre chat et lui coller un nez de chien, des oreilles de chien, mais en gardant le corps du chat. Le résultat ressemble à un monstre étrange, un "chat-chien" qui n'existe pas dans la nature. C'est mathématiquement juste, mais plausible ? Non. C'est comme si on vous disait : "Pour gagner au loto, il faut que vous ayez 3 bras". Techniquement possible dans un univers parallèle, mais pas dans la réalité.

💡 La Solution : La méthode "Soft-DTW" des auteurs

Marcin, Krzysztof et Maciej (les auteurs) ont créé une nouvelle méthode pour générer ces explications. Leur but ? Que le "chat-chien" ressemble vraiment à un chien qui existe dans la vraie vie.

Voici comment ils font, avec une analogie simple :

1. Le "Calque" Temporel (Le Soft-DTW)

Les données temporelles (comme un rythme cardiaque) ne sont pas juste une liste de chiffres. C'est une danse dans le temps. Parfois, un battement de cœur est un peu plus rapide, parfois un peu plus lent, mais la forme de la danse reste la même.

Les anciennes méthodes regardaient point par point (le chiffre 10 à la seconde 1, le chiffre 12 à la seconde 2). Si le rythme décale de 1 seconde, elles pensent que c'est une erreur.

Les auteurs utilisent une technique appelée Soft-DTW.

  • L'image : Imaginez que vous avez un dessin de chien (la classe cible) et votre dessin de chat (votre cas actuel). Au lieu de les superposer parfaitement et de dire "ceci ne correspond pas", vous utilisez un calque élastique. Vous pouvez étirer ou comprimer légèrement le temps pour que les formes s'alignent parfaitement, même si l'un est un peu plus rapide que l'autre.

2. Le "Groupe de Copains" (Les k-plus proches voisins)

Pour s'assurer que leur nouveau dessin ressemble vraiment à un chien, ils ne devinent pas au hasard. Ils regardent un groupe de vrais chiens (les données d'entraînement de la classe "chien").

  • Le processus : Ils prennent leur "chat modifié" et demandent : "Est-ce que ce dessin ressemble à l'un de nos vrais chiens ?". Si ce n'est pas le cas, ils ajustent le dessin jusqu'à ce qu'il soit indistinguable d'un vrai chien, tout en restant proche du chat original.

🏆 Les Résultats : Un compromis intelligent

En testant leur méthode sur de vraies données (comme des ECG ou des données industrielles), ils ont découvert quelque chose d'intéressant :

  • Les anciennes méthodes faisaient de très petits changements (très proches de l'original), mais le résultat final était souvent bizarre ou ne fonctionnait pas vraiment (l'IA ne changeait pas d'avis).
  • La nouvelle méthode fait des changements un peu plus grands (elle modifie plus de pixels), mais le résultat est parfaitement réaliste.

L'analogie finale :
Si vous voulez transformer une voiture en camion :

  • La vieille méthode vous dit : "Enlève juste deux roues". Résultat : une voiture qui ne roule plus.
  • La nouvelle méthode dit : "Voici comment on transforme la voiture en camion : on allonge le châssis, on ajoute un coffre, on renforce les pneus". C'est un changement plus important, mais le résultat est un véhicule fonctionnel et réaliste.

🎯 En résumé

Ce papier nous apprend que pour expliquer une décision d'IA sur des données qui évoluent dans le temps (comme la santé ou la finance), il ne suffit pas de faire le minimum de changement mathématique. Il faut que le changement ressemble à la réalité.

Leur méthode utilise une sorte de "magnétisme temporel" pour attirer la réponse vers des exemples réels et cohérents, garantissant que les explications données aux humains sont non seulement justes, mais aussi crédibles et utiles.