Understanding Neural Network Systems for Image Analysis using Vector Spaces and Inverse Maps

Each language version is independently generated for its own context, not a direct translation.

Das große Rätsel: Wie denkt eine KI?

Stell dir vor, du hast einen sehr cleveren Roboter (ein neuronales Netz), der Bilder von Ziffern (wie auf Briefumschlägen) erkennt. Er ist super gut darin, eine "3" von einer "8" zu unterscheiden. Aber das Problem ist: Niemand weiß genau, wie er das macht. Es ist wie eine Blackbox. Wenn du ihn fragst: "Warum hast du das als 8 erkannt?", sagt er nur: "Weil meine inneren Räder so gedreht haben."

Die Autoren dieses Papiers wollen diese Blackbox öffnen. Sie nutzen keine komplizierte Magie, sondern einfache Mathematik aus der Schule (Lineare Algebra), um zu verstehen, was in den einzelnen Schichten des Roboters passiert.

Die vier fundamentalen Räume: Ein Filter-System

Stell dir jede Schicht des neuronalen Netzwerks als einen riesigen Sieb oder Filter vor, durch den das Bild fließt. Die Autoren sagen: Um zu verstehen, wie dieser Filter funktioniert, müssen wir uns vier verschiedene "Räume" oder Bereiche ansehen.

Der Signal-Raum (Das, was zählt):
Das ist der Teil des Bildes, den der Filter sieht und beibehält. Stell dir vor, du hast ein Bild, und der Filter ist wie ein Suchscheinwerfer. Er beleuchtet nur die wichtigen Linien (z. B. die Kurven einer 8). Alles, was im Lichtkegel liegt, ist das "Signal".
- Analogie: Wenn du nach einem roten Ball suchst, ist der "Signal-Raum" alles, was rot ist.
Der Signal-Ausgangs-Raum (Das Ergebnis):
Das ist das Bild, das nach dem Filter herauskommt. Es ist die Version des Bildes, die der Roboter weiterverarbeitet.
- Analogie: Das ist der Korb, in den du nur die roten Bälle wirfst.
Der Abgewiesene-Signal-Raum (Der Müll):
Das ist der wichtigste Teil für das Verständnis! Das ist alles, was der Filter ignoriert oder wegwirft. Wenn das Bild eine "8" ist, aber der Filter nur auf gerade Linien achtet, werden die runden Teile der 8 als "Abgewiesenes Signal" behandelt.
- Analogie: Stell dir vor, du hast einen Sieb mit großen Löchern. Die Steine (wichtige Linien) bleiben drin, aber der Sand (wichtige Details oder Rauschen) fällt durch. Der Sand ist das "abgewiesene Signal". Die Autoren zeigen uns diesen Sand, um zu sehen, was der Roboter nicht sieht.
Der Abgewiesene-Ausgangs-Raum:
Das sind Dinge, die gar nicht erst in den Korb (Ausgang) passen könnten, egal was du reingibst.

Was haben die Forscher entdeckt?

Die Autoren haben diese Methode auf verschiedene Roboter angewendet:

Der einfache Roboter (1-Schicht-Netz): Hier sahen sie, dass der Filter sehr klar zwischen "wichtig" und "unwichtig" unterscheidet. Bei der Zahl "8" war das abgewiesene Signal (der Sand, der durchfiel) immer noch eine dunkle "8". Das bedeutet: Der Filter hat die Form der 8 so perfekt erkannt, dass er den Rest einfach wegwerfen konnte.
Der komplexe Roboter (ResNet18): Das ist ein sehr tiefer, komplizierter Roboter. Hier sahen sie, dass die Filter sehr spezifisch sind. Manche Filter sehen nur vertikale Linien, andere nur diagonale. Es ist wie ein Team von Spezialisten: Einer schaut nur nach links-rechts, einer nach oben-unten.
- Interessanter Fakt: Bei diesem komplexen Roboter waren alle Filter fast gleich wichtig (kein Filter war viel stärker als der andere). Das ist ein Zeichen für ein sehr stabiles und gut funktionierendes System.

Der Rückwärtsgang: Bilder aus dem Nichts erschaffen

Ein weiterer cooler Teil des Papiers ist die Idee der umkehrbaren Netze. Normalerweise ist ein neuronales Netz wie ein Einbahnstraßensystem: Du gibst ein Bild ein, und es kommt eine Zahl heraus. Aber wie sieht das Bild aus, das genau diese Zahl ergeben würde?

Die Autoren nutzen ihre Mathematik, um den "Rückwärtsgang" zu fahren. Sie nehmen das gewünschte Ergebnis (z. B. "Ich will eine perfekte 5") und rechnen zurück, um zu sehen, welches Bild das erzeugt hätte.

Das Ergebnis: Bei einfachen Netzen konnten sie sehr klare Bilder zurückrechnen. Bei den komplexen Netzen wurden die Bilder manchmal etwas unscharf oder wie eine Schwarz-Weiß-Zeichnung, aber es funktionierte trotzdem!

Warum ist das wichtig?

Bisher haben wir KI-Systeme wie Zauberer behandelt: Sie funktionieren, aber wir verstehen nicht, wie.
Diese Forschung gibt uns eine Brille, um hineinzusehen.

Wir können sehen, was die KI ignoriert (der abgewiesene Raum).
Wir können sehen, welche Muster sie sucht (die Signal-Räume).
Wir können sogar rückwärts rechnen, um zu verstehen, was die KI braucht, um eine Entscheidung zu treffen.

Das ist besonders wichtig in Bereichen wie der Medizin. Wenn eine KI einen Tumor erkennt, wollen wir nicht nur wissen, dass sie ihn erkennt, sondern welche Teile des Bildes sie dafür benutzt hat und ob sie vielleicht wichtige Details übersehen hat.

Zusammenfassend: Die Autoren haben gezeigt, dass man mit einfacher Mathematik (Vektorräumen) die komplexe Welt der KI-Neuronen entzaubern kann, indem man genau hinschaut, was behalten wird und was weggeworfen wird.

Each language version is independently generated for its own context, not a direct translation.

Titel: Verständnis neuronaler Netzwerke für die Bildanalyse mittels Vektorräumen

Autoren: Rebecca Pattichis (UCLA) und Marios S. Pattichis (University of New Mexico)

1. Problemstellung

Trotz der hervorragenden Leistung neuronaler Netze in der Bildanalyse fehlt es oft an Interpretierbarkeit. Es ist unklar, welche Bildrepräsentationen von den verschiedenen Schichten des Netzes erfasst werden und welche Informationen verworfen werden. Mit dem zunehmenden Einsatz dieser Modelle in kritischen Bereichen (z. B. Biomedizin) wird die Notwendigkeit interpretierbarer Modelle immer dringlicher. Bestehende Visualisierungsmethoden (wie Saliency Maps oder das Anzeigen von Filtern) greifen oft zu kurz, da sie nicht systematisch auf den mathematischen Fundamenten der linearen Algebra basieren, um den Informationsfluss zu quantifizieren.

2. Methodik

Die Autoren schlagen einen Ansatz vor, der Lineare Algebra und die vier fundamentalen Vektorräume einer Gewichtsmatrix nutzt, um die Transformation von Eingabebildern zu Ausgabebildern zu modellieren.

A. Die vier fundamentalen Signalräume

Für eine Schicht mit der Gewichtsmatrix $W$ und Eingabevektor $x$ (flachgestelltes Bild) wird das Modell $y = Wx$ (ohne Bias) betrachtet. Die vier Räume werden wie folgt definiert:

Signalraum (Signal Space): Entspricht dem Zeilenraum von $W$ ($RowSpace(W)$). Er repräsentiert die Komponenten des Eingabebildes, die vom Netz als „Signal" interpretiert und weiterverarbeitet werden.
Ausgabe-Signalraum (Signal Output Space): Entspricht dem Spaltenraum von $W$ ($ColumnSpace(W)$). Er definiert die Menge aller erreichbaren Ausgabebilder.
Abgelehntes Signal (Rejected Signal Space): Entspricht dem Nullraum von $W$ ($NullSpace(W)$). Dies sind Eingabebilder (oder Komponenten), die vom Netz ignoriert werden ($Wx = 0$).
Abgelehnter Ausgabe-Raum (Rejected Output Space): Entspricht dem linken Nullraum von $W$ ($LeftNullSpace(W)$).

Der Eingaberaum wird in Signalraum und abgelehntes Signal zerlegt ( $R^n = Signal(W) \oplus RejSignal(W)$ ). Dies ermöglicht die Analyse, welche Bildanteile verloren gehen.

B. Projektion und Residuen

Für einzelne Neuronen (Gewichtsvektoren $w$ ) wird die Eingabe $x$ auf $w$ projiziert. Das Residuum ( $x - p$ ) repräsentiert den Teil des Bildes, der vom Neuron ignoriert wird. Die Energie des Bildes lässt sich in die Projektion (Signal) und das Residuum (Ignoriertes) aufteilen. Dies dient der Erklärbarkeit: Ein gutes Residuum sollte keine wichtigen Signalinformationen enthalten.

C. Singulärwertzerlegung (SVD)

Für Gewichtsmatrizen wird die SVD ( $W = U\Sigma V^T$ ) verwendet, um die relativen Bedeutungen der Eigenvektoren (Signalrichtungen) durch die Singulärwerte zu visualisieren. Ein niedriger Konditionszahl (nahe 1) deutet auf eine stabile Zerlegung hin.

D. Invertierbare Netze und Eingabegenerierung

Ein weiterer Fokus liegt auf der Berechnung von Eingabebildern, die zu spezifischen Ausgaben führen (Inverse Mapping).

Bei invertierbaren Aktivierungsfunktionen (z. B. SELU, tanh) kann die Eingabe durch Iteration rückwärts berechnet werden: $x = W^+ f^{-1}(Out)$ .
Für nicht-invertierbare Netze oder zur Generierung realistischer Bilder wird ein Optimierungsansatz gewählt: Es wird das Eingabebild gesucht, das den Abstand zu einem „idealen Output" minimiert. Als Startpunkte dienen Durchschnittsbilder (avg-img), Minimalbilder (min-img) oder Mittelwerte der besten 25 % (avg-min-img) des Trainingsdatensatzes.

3. Wichtige Beiträge

Neue Interpretationsperspektive: Erstmals werden neuronale Netze systematisch durch die vier fundamentalen Vektorräume analysiert, um zu verstehen, welche Bildkomponenten transformiert und welche verworfen werden.
Visualisierung von Residuen: Die Methode visualisiert explizit den Informationsverlust pro Schicht durch die Darstellung der Residuenbilder.
Invertierbarkeit als Werkzeug: Die Nutzung von Vektorräumen zur Rekonstruktion von Eingabebildern aus Ausgaben, insbesondere bei invertierbaren Architekturen.
Vergleich von Architekturen: Die Anwendung der Methode auf einfache Fully Connected Networks (FCNN) und komplexe ResNet18-Architekturen.

4. Ergebnisse

Die Methode wurde auf dem MNIST-Datensatz (10 Klassen) mit drei Architekturen getestet:

1-Schicht FCNN: 92 % Genauigkeit. Die Analyse der Signalräume zeigte eine klare Abnahme der Bedeutung der Signalvektoren (hoher Konditionszahl von 7,22). Die Residuenbilder zeigten, dass das Netz für bestimmte Ziffern (z. B. 8) die relevanten Informationen erfolgreich extrahiert (dunkle Residuen), während bei anderen (z. B. 1) aufgrund fehlender Translationsinvarianz noch Signale im Residuum verblieben.
5-Schicht FCNN: 97 % Genauigkeit.
ResNet18: 99 % Genauigkeit.
- Ergebnis bei ResNet: Die erste Faltungsschicht zeigte starke Richtungsselektivität in den Signal-Kernen (z. B. vertikale Dominanz, diagonale Dominanz). Der Konditionszahl von 1,07 deutete darauf hin, dass alle Signal-Kernel von gleicher Wichtigkeit sind.
- Generierte Eingaben: Bei komplexen Netzen (ResNet) verbesserte das Nachtrainieren der Eingabeschicht die generierten Bilder nicht signifikant; diese erschienen oft binarisiert oder unscharf. Bei den einfacheren FCNNs war das Training der Eingabe effektiver. Dennoch erwies sich die Initialisierung basierend auf Trainingsbildern als sehr erfolgreich.

5. Bedeutung und Ausblick

Das Paper liefert einen mathematisch fundierten Rahmen, um neuronale Netze nicht nur als Blackbox, sondern als lineare Abbildungen zwischen Signalräumen zu verstehen.

Interpretierbarkeit: Durch die Trennung von Signal und Residuum können Entwickler genau sehen, welche Bildmerkmale in einer Schicht „verloren" gehen.
Invertierbarkeit: Die Arbeit zeigt, dass invertierbare Netze eine einfache Rückprojektion von Ausgabe- in Eingaberäume ermöglichen.
Zukunft: Es bleibt zu untersuchen, ob invertierbare Netze die Leistung nicht-invertierbarer Netze (wie ResNet) erreichen können, während sie gleichzeitig die Vorteile der leichten Rekonstruierbarkeit bieten.

Zusammenfassend bietet der Ansatz eine Brücke zwischen der abstrakten linearen Algebra und der praktischen Bildanalyse, um die Funktionsweise tiefer neuronaler Netze transparenter zu machen.