Counterfactual Explanations on Robust Perceptual Geodesics

Die Arbeit stellt Perceptual Counterfactual Geodesics (PCG) vor, eine Methode, die mithilfe einer auf robusten visuellen Merkmalen basierenden riemannschen Metrik semantisch gültige und auf dem Datenmanifold liegende kontrafaktische Erklärungen generiert, um die durch herkömmliche flache Geometrien verursachten Artefakte und adversarialen Zusammenbrüche zu überwinden.

Eslam Zaher, Maciej Trzaskowski, Quan Nguyen, Fred Roosta

Veröffentlicht 2026-03-03
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du hast einen sehr klugen, aber manchmal etwas verwirrten KI-Assistenten, der Bilder analysiert. Du zeigst ihm ein Foto von einer Katze, und er sagt: „Das ist eine Katze."

Jetzt möchtest du dem Assistenten erklären, wie man das Bild so verändern müsste, damit er plötzlich sagt: „Aha! Das ist jetzt ein Hund." Das nennt man eine konträre Erklärung (Counterfactual Explanation). Es ist wie die Frage: „Was müsste ich ändern, damit das Ergebnis anders ausfällt?"

Das Problem ist: Wenn man versucht, diese Veränderung mit herkömmlichen Methoden zu berechnen, passiert oft etwas Seltsames. Die KI versucht, das Bild zu verändern, indem sie winzige, für das menschliche Auge unsichtbare Pixel-Veränderungen macht. Das Ergebnis ist dann zwar technisch gesehen ein „Hund" für die KI, sieht aber für uns aus wie ein verrauschtes, unkenntliches Bild oder ein Monster. Die KI hat den Weg genommen, der für sie am einfachsten war, aber nicht für uns.

Die Lösung: PCG – Der „Robuste Pfadfinder"

Die Autoren dieses Papers haben eine neue Methode namens PCG (Perceptual Counterfactual Geodesics) entwickelt. Um zu verstehen, wie das funktioniert, nutzen wir eine einfache Analogie:

1. Das Problem: Der flache Boden vs. der hügelige Berg

Stell dir die Welt aller möglichen Bilder als eine riesige, flache Ebene vor.

  • Die alten Methoden laufen einfach in einer geraden Linie von der „Katze" zur „Hund"-Position. Da die Ebene aber flach ist, laufen sie oft über „Abgründe" oder durch „Sumpfgebiete" (in der Fachsprache: Off-Manifold). Das Ergebnis sind Bilder, die in der echten Welt gar nicht existieren würden – wie ein Hund mit drei Beinen oder einer Katze mit einem Fischschwanz.
  • Das Problem: Die KI denkt, sie sei auf dem richtigen Weg, weil sie nur auf die mathematische Distanz schaut, nicht darauf, ob das Bild „echt" aussieht.

2. Die Lösung: Der Bergpfad (Geodäte)

Die Autoren sagen: „Nein, die Welt der Bilder ist nicht flach! Sie ist wie ein bergiges Gelände mit Tälern und Gipfeln."

  • Ein Gipfel ist ein perfektes Bild einer Katze.
  • Ein anderes Gipfel ist ein perfektes Bild eines Hundes.
  • Die Täler dazwischen sind die „echten" Übergänge (z. B. ein Tier, das langsam von katzenartig zu hundeartig wird).

Die neue Methode PCG sucht nicht den kürzesten Weg über die flache Ebene, sondern den schönsten, sanftesten Pfad über die Berge von der Katze zum Hund. Dieser Pfad wird Geodäte genannt. Er bleibt immer auf dem „Boden der Tatsachen" (auf dem Berg), damit jedes Zwischenergebnis ein echtes, erkennbares Tier ist.

3. Der Kompass: Robuste Features

Aber wie findet man diesen Pfad? Man braucht einen Kompass, der nicht getäuscht werden kann.

  • Normale KI-Modelle haben einen Kompass, der leicht getäuscht wird. Sie sehen nur die Oberfläche und lassen sich von kleinen Störungen (wie Rauschen) ablenken.
  • PCG nutzt einen robusten Kompass. Dieser Kompass wurde trainiert, um wirklich zu verstehen, was ein Tier ausmacht (Ohrenform, Fellstruktur, Schnauze), und ignoriert kleine, täuschende Details. Er sagt: „Geh nicht durch den Sumpf, geh den Weg, der sich für ein menschliches Auge natürlich anfühlt."

Was passiert im Detail? (Die zwei Phasen)

Die Methode läuft in zwei Schritten ab, wie eine Reiseplanung:

  1. Phase 1: Der grobe Überblick
    Man zeichnet erst einmal eine Linie von der Katze zu einem zufälligen Hund auf der Karte. Man glättet diese Linie so, dass sie immer auf dem Berg bleibt und keine Abgründe berührt. Das Ergebnis ist ein sanfter Übergang, der zwar noch nicht perfekt ist, aber schon „echt" aussieht.

  2. Phase 2: Das Feintuning
    Jetzt passt man das Ziel an. Man schiebt den Endpunkt (den Hund) so nah wie möglich an das Startbild (die Katze), ohne dass die KI die Klasse wechselt. Man sucht also den kleinstmöglichen Unterschied, der ausreicht, damit die KI sagt: „Hund!", aber der für uns noch wie eine Katze aussieht, die sich langsam in einen Hund verwandelt.

Warum ist das wichtig?

  • Keine Monster mehr: Die Bilder, die PCG erzeugt, sehen aus wie echte Fotos. Es gibt keine seltsamen Artefakte oder verzerrten Gesichter.
  • Verständlich: Man kann genau sehen, was sich geändert hat (z. B. die Ohren wurden spitzer, das Fell wurde kürzer).
  • Sicher: Die Methode verhindert, dass die KI „schummelt", indem sie unsichtbare Fehler in das Bild einbaut, um die Antwort zu ändern.

Zusammenfassung in einem Satz

PCG ist wie ein erfahrener Bergführer, der dich nicht den gefährlichen, geraden Weg durch den Abgrund nimmt, sondern dich den sicheren, sanften Pfad über die Berge führt, damit du von einer Katze zu einem Hund kommst, ohne dabei dein Gesicht zu verlieren.

Die Forscher haben gezeigt, dass diese Methode besser funktioniert als alle bisherigen Techniken und dass sie die „Fallstricke" vermeidet, bei denen KI-Modelle sonst in die Irre gehen.