VISIONLOGIC: From Neuron Activations to Causally Grounded Concept Rules for Vision Models

Each language version is independently generated for its own context, not a direct translation.

VISIONLOGIC: Wie wir KI-Modelle endlich verstehen lernen – Eine Reise vom „Gehirn" zur „Logik"

Stellen Sie sich vor, Sie haben einen hochintelligenten, aber extrem schweigsamen Assistenten. Er kann Bilder perfekt erkennen (z. B. „Das ist ein Wolf, das ist ein Husky"), aber wenn Sie ihn fragen: „Warum?", starrt er Sie nur an. Er gibt Ihnen keine Erklärung, sondern nur ein Ergebnis. Das ist das Problem mit modernen KI-Modellen: Sie sind wie eine Blackbox.

Die Forscher um Chuqin Geng und sein Team haben eine Lösung namens VISIONLOGIC entwickelt. Man kann sich das wie einen Übersetzer vorstellen, der die geheime Sprache der KI in eine klare, logische Geschichte verwandelt, die auch ein Mensch verstehen kann.

Hier ist die Idee in einfachen Schritten, mit ein paar kreativen Vergleichen:

1. Das Problem: Nur Korrelation, keine Kausalität

Bisherige Methoden waren wie ein Detektiv, der nur Gerüchte sammelt.

Beispiel: Die KI sieht oft Kühe auf Wiesen. Ein alter Detektiv schließt daraus: „Ah, wenn ich Gras sehe, ist es eine Kuh!"
Der Fehler: Das ist nur eine Korrelation (beides kommt oft zusammen vor). Aber wenn die KI ein Bild von einer Kuh auf einem Fußballfeld sieht, ist sie verwirrt. Oder schlimmer: Sie verwechselt einen Wolf, der auf Gras steht, mit einem Husky, nur weil beide auf Gras stehen.
Das Problem: Diese alten Methoden wissen nicht, was die KI wirklich braucht, um zu entscheiden. Sie kennen nur die „Bekannten", nicht die „Ursachen".

2. Die Lösung: VISIONLOGIC als „Logik-Architekt"

VISIONLOGIC macht etwas anderes. Es baut nicht nur eine Liste von Vermutungen auf, sondern prüft jede Idee auf ihre Wahrheit. Man kann sich das wie einen Wissenschaftler im Labor vorstellen, der Experimente durchführt.

Der Prozess läuft in drei Schritten ab:

Schritt 1: Vom Chaos zum klaren Satz (Die Neuronen-Übersetzer)

Das Gehirn der KI besteht aus Millionen von kleinen Schaltern (Neuronen), die wild hin und her blinken.

VISIONLOGIC schaut sich diese Blinker an und sagt: „Okay, wenn Schalter Nr. 450 hell aufleuchtet, nennen wir das einfach 'Habe spitze Ohren'."
Es verwandelt das chaotische elektrische Signal in klare Wahrheitswerte (Ja/Nein). Das ist wie das Übersetzen von einem wirren Code in einfache Sätze wie: „Wenn es Fell hat UND spitze Ohren, dann ist es ein Hund."

Schritt 2: Der große Test (Das „Was-wäre-wenn"-Spiel)

Jetzt kommt der magische Teil. Die KI hat eine Regel gefunden: „Spitze Ohren = Wolf". Aber ist das wirklich der Grund?

VISIONLOGIC nimmt ein Bild und schneidet (oder verdeckt) den Bereich mit den spitzen Ohren digital aus.
Die Frage: „Wenn ich die Ohren wegnehme, erkennt die KI das Tier immer noch als Wolf?"
Das Ergebnis: Wenn die KI plötzlich sagt: „Ich weiß nicht mehr, was das ist", dann haben wir einen bewiesenen Beweis (Kausalität). Die spitzen Ohren sind wirklich wichtig.
Wenn die KI trotzdem „Wolf" sagt, war die Regel falsch (vielleicht war es nur der Hintergrund). VISIONLOGIC verwirft diese Regel sofort.

Schritt 3: Die logische Regel

Am Ende hat VISIONLOGIC nicht nur ein Bild, auf dem ein roter Kreis um die Ohren liegt. Es hat eine klare Regel geschrieben:

„Wenn das Bild spitze Ohren hat UND einen buschigen Schwanz, dann ist es ein Wolf."

Diese Regel ist kompakt, logisch und – das Wichtigste – wahr, weil sie durch den „Schneiden-Test" bewiesen wurde.

Warum ist das so toll? (Die Vorteile)

Keine falschen Freunde mehr: Früher dachte die KI vielleicht, „Gras" sei ein Grund für „Kuh". VISIONLOGIC testet das: Wenn wir das Gras wegnehmen, ist es immer noch eine Kuh? Ja. Also ist Gras nicht der Grund. Die KI lernt, sich auf das Wesentliche (die Kuh selbst) zu konzentrieren.
Menschen verstehen es: Statt komplizierter Farbkarten (wie bei alten Methoden) bekommen wir klare Sätze und Bilder, die zeigen, wo die KI hinschaut.
Es funktioniert überall: Ob die KI ein altes Modell (CNN) oder ein modernes, komplexes Modell (ViT) ist – VISIONLOGIC kann beide „übersetzen".

Ein Bild zur Veranschaulichung

Stellen Sie sich vor, Sie schauen einem Magier beim Zaubertrick zu.

Alte Methoden sagen: „Der Magier hat eine weiße Taube gesehen, also zaubert er." (Das ist nur ein Zufall).
VISIONLOGIC sagt: „Ich nehme die weiße Taube weg. Der Magier macht trotzdem den Trick. Okay, die Taube ist nicht wichtig. Ich nehme den Hut weg. Der Trick funktioniert nicht mehr! Aha! Der Hut ist der Schlüssel."

Fazit

VISIONLOGIC ist wie ein ehrlicher Dolmetscher für die KI. Es holt die KI aus ihrer Blackbox, prüft jede ihrer Annahmen mit einem wissenschaftlichen Experiment und gibt uns am Ende eine verständliche, logische Regel an die Hand. Das ist ein riesiger Schritt hin zu vertrauenswürdiger KI, die wir nicht nur benutzen, sondern auch wirklich verstehen können.

Each language version is independently generated for its own context, not a direct translation.

1. Problemstellung

Trotz der hohen Leistungsfähigkeit von Deep-Learning-Modellen für die Bilderkennung (z. B. CNNs und Vision Transformers/ViTs) bleibt deren „Black-Box"-Charakter ein Haupthindernis für vertrauenswürdige KI. Bestehende konzeptbasierte Erklärungsansätze (wie TCAV oder ACE) verbessern die Interpretierbarkeit gegenüber pixelbasierten Attributionskarten, leiden jedoch unter einem fundamentalen Mangel: Sie basieren fast ausschließlich auf korrelativen Signalen ohne kausale Validierung.

Dies führt zu potenziell unzuverlässigen Erklärungen, bei denen Korrelationen fälschlicherweise als Kausalität interpretiert werden (z. B. wird das Konzept „Weide" mit der Klasse „Kuh" assoziiert, nur weil sie im Trainingsdatensatz häufig gemeinsam auftreten, obwohl die Weide nicht kausal für die Klassifizierung ist). Es fehlt an einer methodischen Grundlage, um robuste, interpretierbare Konzepte durch kausale Tests zu validieren.

2. Methodik: Das VISIONLOGIC-Framework

VISIONLOGIC ist ein neuartiges neuro-symbolisches Framework, das vertrauenswürdige, hierarchische Erklärungen in Form globaler logischer Regeln über kausal validierte Konzepte generiert. Der Prozess läuft in drei Hauptphasen ab:

A. Ableitung von Prädikaten aus Neuronenaktivierungen

Abstraktion: Statt roher Aktivierungen werden binäre Prädikate $p_j(x) \in \{0, 1\}$ gelernt, die als logische Atome dienen.
Lernbare Schwellenwerte: Anstatt willkürlicher Schwellenwerte werden pro Kanal schwellenwertbasierte Parameter ( $T_j$ ) und Schärfe-Parameter ( $s_j$ ) gelernt. Dies ermöglicht eine differenzierbare Gate-Funktion während des Trainings, die später zu einem harten Booleschen Schwellenwert wird.
Ranking-basierte Selektion: Um Polysemie (ein Neuron kodiert mehrere Konzepte) zu handhaben, werden Prädikate basierend auf ihrem Beitrag zur Klassifizierung rankiert. Es wird ein „Top-k"-Gate verwendet, um sicherzustellen, dass nur die relevantesten Aktivierungen als Prädikate ausgewählt werden.
Ziel: Die Umwandlung von kontinuierlichen Neuronenaktivierungen in eine kompakte, wiederverwendbare Vokabular von Prädikaten.

B. Induktion logischer Regeln und Inferenz-Scores

Regelgenerierung: Aus den binären Prädikaten werden disjunktive Normalformen (DNF) abgeleitet, die die Klassifizierungsmuster der Trainingsdaten für jede Klasse abbilden.
Inferenz-Score: Für ein Testbild wird ein Erklärungs-Score $S(x, c)$ berechnet, der auf dem Ranking der aktiven Prädikate für eine Klasse $c$ basiert. Die Klasse mit dem niedrigsten Score (d. h. den charakteristischsten Prädikaten) wird vorhergesagt.
Ergebnis: Dies erzeugt kompakte, globale logische Regeln, die das Entscheidungsverhalten des ursprünglichen Modells approximieren.

C. Kausale Verankerung (Grounding) visueller Konzepte

Dies ist der Kernunterschied zu vorherigen Methoden. VISIONLOGIC verknüpft abstrakte Prädikate mit visuellen Konzepten durch Ablations-basierte kausale Tests:

Initialisierung: Ein Bounding-Box wird initialisiert, der den Bereich abdeckt, der das Prädikat wahrscheinlich beeinflusst (basierend auf Feature-Maps bei CNNs oder Patch-Grids bei ViTs).
Iterative Verfeinerung: Der Bereich wird schrittweise verkleinert. Ein Bereich wird als kausal wichtig bestätigt, wenn das Abdecken (z. B. durch Rauschen) die Aktivierung des Prädikats von 1 auf 0 flippt (Notwendigkeit).
Suffizienz-Test: Es wird geprüft, ob das Prädikat aktiviert bleibt, wenn nur dieser Bereich sichtbar ist und der Rest Rauschen ist.
Segmentierung: Zur präzisen Anpassung an Objektgrenzen werden Segmentierungsmasken (z. B. von SAM oder Mask R-CNN) mit dem verfeinerten Bounding-Box geschnitten und der kausale Test erneut durchgeführt.
Konsolidierung: Validierte Regionen über mehrere Bilder derselben Klasse werden aggregiert, um konsistente visuelle Konzepte zu bilden.

3. Hauptbeiträge

Neues Framework: VISIONLOGIC ist das erste Framework, das kausal validierte Konzepte mit interpretierbaren logischen Regel-Erklärungen kombiniert.
Effizienter Algorithmus: Entwicklung eines iterativen Verfeinerungsalgorithmus, der mittels Bounding-Boxen und Segmentierungsmasken kausal relevante Bildregionen präzise lokalisiert.
Großangelegte Human-Evaluation: Eine umfassende Studie zeigt, dass VISIONLOGIC das Verständnis des Modellverhaltens bei Menschen signifikant verbessert im Vergleich zu State-of-the-Art-Methoden (ACE, CRAFT).
Erhaltung der Leistung: Die extrahierten Regeln behalten die diskriminative Kraft der Originalmodelle weitgehend bei (hohe Top-5-Genauigkeit), obwohl sie auf symbolischen Regeln basieren.

4. Ergebnisse und Evaluation

Menschliche Bewertung (Human Evaluation)

Setup: 531 Teilnehmer wurden in drei Szenarien getestet (Erkennung von Bias, Identifizierung nicht-offensichtlicher Strategien, Verständnis von Fehlerfällen).
Metrik: Der „Utility Score" misst, wie gut Teilnehmer die Modellentscheidungen auf neuen Bildern vorhersagen können.
Ergebnis: VISIONLOGIC übertraf in allen Szenarien signifikant die Baseline, Kontrollgruppen (Saliency Maps) sowie die fortschrittlichsten Methoden ACE und CRAFT.
- Im „Husky vs. Wolf"-Szenario erreichte VISIONLOGIC einen Utility-Score von 1,25 (im Vergleich zu 1,00 für die Baseline).
- Statistische Tests (Kruskal-Wallis und Dunn's Test) bestätigten die Signifikanz der Verbesserungen ( $p < 0,05$ ).

Technische Leistung auf Vision-Modellen

Architekturen: Evaluiert auf ResNet, ConvNeXt, ViT und Swin Transformer auf ImageNet-1k.
Abdeckung & Treue: VISIONLOGIC erreichte eine Abdeckung von 80–89 % der Bilder und eine hohe Treue (Fidelity) von 76–88 % auf den abgedeckten Bildern.
Genauigkeit: Die regelbasierten Vorhersagen erzielten konkurrenzfähige Top-1- und Top-5-Genauigkeiten (z. B. ViT: 80,70 % Top-1, 97,38 % Top-5), was zeigt, dass die symbolischen Regeln das diskriminative Signal des neuronalen Netzes bewahren.

Qualitative Analyse

Polysemie: Das Framework erkennt, dass ein Prädikat mehrere Konzepte kodieren kann (z. B. „dreieckige Form" für Fuchsohren und Kirchtürme) und umgekehrt.
Globale Struktur: Top-rankierte Prädikate kodieren oft globale Objektstrukturen (ganze Tiere oder Gebäude), während lokale Prädikate häufiger über Klassen hinweg geteilt werden.
CNNs vs. ViTs: ViTs neigen dazu, mehr Prädikate pro Konzept zu verwenden, während CNNs spärlichere, distinktere Kodierungen aufweisen.

5. Bedeutung und Ausblick

VISIONLOGIC schließt eine kritische Lücke in der KI-Interpretierbarkeit, indem es von rein korrelativen Hinweisen zu kausal validierten Erklärungen übergeht. Dies ist entscheidend für Hochrisiko-Anwendungen, bei denen Vertrauen und Nachvollziehbarkeit unerlässlich sind.

Vertrauenswürdigkeit: Durch kausale Tests werden „Spurious Correlations" (zufällige Korrelationen) eliminiert, was zu ehrlicheren Erklärungen führt.
Brücke zur Symbolik: Das Framework verbindet neuronale Repräsentationen mit symbolischem Denken, was den Weg für hybride KI-Systeme ebnet, die sowohl lernfähig als auch logisch nachvollziehbar sind.
Zukünftige Arbeit: Die Autoren planen, die logischen Regeln auf niedrigere visuelle Merkmale (Kanten, Texturen) aus früheren Netzwerkschichten zu erweitern, um noch reichhaltigere hierarchische Erklärungen zu ermöglichen.

Zusammenfassend bietet VISIONLOGIC einen robusten, skalierbaren Ansatz, um die Entscheidungsfindung komplexer Vision-Modelle für Menschen verständlich und kausal fundiert zu machen.