Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba

Gepubliceerd Tue, 10 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Hoe maak je een "wat als"-verhaal voor tijdreeksen dat echt geloofwaardig is?

Stel je voor dat je een slimme computer hebt die kan voorspellen of een patiënt een hartaanval krijgt, of of een fabrieksmachine gaat stuk. Deze computer kijkt naar een grafiek die de tijd weergeeft (zoals een hartslaglijn of trillingen van een machine). Soms zegt de computer: "Dit is gevaarlijk!" Maar de arts of de technicus vraagt zich af: "Waarom? En wat zou er anders moeten gebeuren zodat de computer zegt: 'Dit is veilig'?"

Dat is waar counterfactual explanations (tegenstrijdige verklaringen) voor dienen. Het is het antwoord op de vraag: "Wat is het kleinste beetje verandering dat ik moet maken in deze grafiek, zodat het resultaat anders wordt?"

Het probleem is echter: de meeste bestaande methoden maken veranderingen die er onrealistisch uitzien. Het is alsof de computer zegt: "Als je de hartslaglijn hier en daar een beetje verandert, ben je veilig." Maar die veranderingen lijken op ruis of glitches, niet op een echte, gezonde hartslag. Dat is niet nuttig voor een mens.

De auteurs van dit paper hebben een nieuwe manier bedacht om deze "wat als"-scenario's te maken die er echt uitzien. Hier is hoe ze dat doen, vertaald naar alledaagse taal:

1. Het Probleem: De "Vervormde Spiegel"

Stel je voor dat je een danser bent (de computer) die een beweging moet nabootsen. Bestaande methoden zijn alsof je de danser een spiegel voorhoudt en zegt: "Beweeg net zo, maar dan een beetje anders." De danser doet dat, maar het resultaat is een gestommel dat eruitziet als een robot die struikelt. Het is technisch gezien een andere beweging, maar het voelt niet als een echte dans.

In de wereld van data noemen we dit plausibiliteit (geloofwaardigheid). Een goede verklaring moet eruitzien als een echte, natuurlijke gebeurtenis, niet als een computerfoutje.

2. De Oplossing: De "Dansleraar" (Soft-DTW)

De auteurs gebruiken een slimme truc. Ze zeggen: "Laten we niet raden hoe de beweging eruit moet zien. Laten we kijken naar echte voorbeelden van goede dansers (de 'doelgroep' in de data)."

Ze gebruiken een meetlat genaamd Soft-DTW (Dynamic Time Warping).

  • De Analogie: Stel je voor dat je een nieuwe dansbeweging bedenkt. In plaats van alleen te kijken of de beweging op het juiste moment gebeurt (wat lastig is als de muziek iets versnelt of vertraagt), laat je een dansleraar kijken.
  • Deze leraar vergelijkt jouw nieuwe beweging met een lijst van de 10 beste dansers van de doelgroep.
  • De leraar zegt: "Je beweging moet lijken op die van deze echte mensen, inclusief hun ritme en flow."
  • De term "Soft" betekent dat de computer dit proces heel soepel doet, zonder te breken. Het is alsof je de dansbeweging kunt "rekken" en "strekken" om hem perfect te laten passen bij de echte voorbeelden, zonder dat het eruitziet als een gedwongen rek.

3. De Beloningssysteem (De Loss Functie)

De computer moet een balans vinden tussen drie dingen, net als een chef-kok die een gerecht moet perfectioneren:

  1. Geldigheid: Het gerecht moet smaken als het doelgerecht (de computer moet het resultaat veranderen).
  2. Dichtbij: Het moet nog wel op het origineel lijken (niet alles volledig vervangen).
  3. Geloofwaardigheid (Plausibility): Het moet eruitzien als een gerecht dat je echt in een restaurant zou krijgen, niet als een experimentele soep van plastic.

De nieuwe methode geeft extra punten voor geloofwaardigheid. Als de computer probeert een verandering te maken die er "raar" uitziet (zoals een schok in een hartslaglijn die nooit voorkomt), krijgt hij een boete. Hij moet dus zoeken naar een verandering die eruitziet als een echte, gezonde hartslag.

4. Wat is het Resultaat?

De auteurs hebben hun nieuwe methode getest tegen andere slimme methoden.

  • De andere methoden: Ze maakten soms kleine veranderingen die er technisch goed uitzagen op papier, maar als je er naar keek, zag je dat het geen echte hartslag of machinebeweging was. Het was alsof ze een foto van een hond hadden gemanipuleerd tot een kat, maar de oren waren nog steeds van de hond.
  • De nieuwe methode: Ze maakten veranderingen die eruitzagen als een echte kat. De vorm, de beweging en het ritme waren perfect.

Het enige nadeel: Omdat ze zo'n hoge eisen stellen aan de geloofwaardigheid, moeten ze soms iets meer aan de grafiek veranderen dan de andere methoden. Het is alsof je om een gerecht te veranderen van "zout" naar "zoet", je niet alleen een snufje suiker toevoegt, maar de hele saus moet herscheppen om het natuurlijk te laten smaken. Het kost iets meer moeite (meer verandering), maar het resultaat is veel beter en betrouwbaarder.

Samenvatting in één zin

Deze paper introduceert een slimme manier om te voorspellen wat er nodig is om een voorspelling te veranderen, waarbij ze zorgen dat het antwoord eruitziet als een echt, natuurlijk gebeuren in plaats van een computerfoutje, door te kijken naar hoe echte voorbeelden eruitzien.