Gauge Freedom and Metric Dependence in Neural Representation Spaces

Each language version is independently generated for its own context, not a direct translation.

Das Geheimnis der unsichtbaren Koordinaten: Warum die Form von KI-Daten trügerisch ist

Stell dir vor, du hast einen riesigen, hochmodernen Koch, der ein Neural-Netzwerk ist. Dieser Koch kann jede Frage beantworten, jedes Bild erkennen und jeden Text verstehen. Aber wie funktioniert er eigentlich im Inneren?

Der Koch verarbeitet Informationen in Schichten. In der Mitte des Kochprozesses wandelt er Zutaten (die Eingabedaten) in Zutaten-Mischungen um. Diese Mischungen sind die "Repräsentationen" – also die Art und Weise, wie die KI die Welt "sieht".

Die Wissenschaftler haben bisher angenommen, dass diese Mischungen eine feste, unveränderliche Form haben. Aber Jericho Cain hat etwas Entdeckendes herausgefunden: Die Form dieser Mischungen ist gar nicht festgelegt. Sie ist wie ein Scherz, den die Mathematik uns spielt.

1. Der Trick mit dem Maßstab (Die "Gauge-Freiheit")

Stell dir vor, du hast eine Landkarte einer Stadt.

Szenario A: Du zeichnest die Karte in Metern.
Szenario B: Du zeichnest dieselbe Karte, aber du streckst sie in Ost-West-Richtung um das Doppelte und stauchst sie in Nord-Süd-Richtung zusammen.

Die Stadt selbst (die Informationen, die der Koch verarbeitet) hat sich nicht verändert. Die Straßen liegen immer noch an derselben Stelle, und du kannst immer noch von Punkt A nach Punkt B kommen. Aber wenn du jetzt auf der neuen Karte den Winkel zwischen zwei Straßen misst oder sagst, wie "nah" zwei Gebäude beieinander liegen, kommen völlig andere Zahlen heraus!

Das ist genau das, was in neuronalen Netzen passiert:

Die KI kann ihre inneren Daten (die Koordinaten) beliebig strecken, stauchen oder drehen.
Solange der nächste Schritt im Netzwerk (der "Koch", der die Antwort gibt) sich anpasst, bleibt das Endergebnis (die Vorhersage) exakt gleich.
Aber die Geometrie – also wie nah sich Dinge im Inneren der KI scheinen – verändert sich dramatisch.

Cain nennt dies "Gauge-Freiheit". Es ist wie die Freiheit, ein Koordinatensystem zu wählen. Ob du Längen in Metern oder Fuß angibst, ändert nichts an der Realität, aber es ändert die Zahlen, die du auf dem Lineal abliest.

2. Der falsche Kompass: Die Kosinus-Ähnlichkeit

In der KI-Welt ist Kosinus-Ähnlichkeit der beliebteste Kompass. Er misst, wie ähnlich zwei Dinge sind, indem er den Winkel zwischen ihnen betrachtet.

Wenn der Winkel klein ist, sind die Dinge ähnlich.
Wenn der Winkel groß ist, sind sie unterschiedlich.

Das Problem? Der Winkel hängt davon ab, wie du die Landkarte verzerrt hast!

Stell dir vor, du hast zwei Freunde, die sich sehr ähnlich sind (sie stehen nah beieinander).

Wenn du die Landkarte normal zeichnest, siehst du, dass sie nah beieinander stehen.
Wenn du die Landkarte jetzt wie einen Gummiballon in die Länge ziehst, rutschen sie plötzlich weit auseinander. Der Winkel zwischen ihnen hat sich geändert, obwohl sie immer noch dieselben Freunde sind.

Cain zeigt in seinem Papier, dass viele Studien, die behaupten, "Diese beiden Wörter sind semantisch ähnlich", eigentlich nur messen, wie die KI zufällig ihre Landkarte gezeichnet hat. Wenn man die Landkarte anders zeichnet (eine andere "Gauge" wählt), könnten diese Wörter plötzlich wie Fremde wirken, obwohl die KI sie immer noch gleich versteht.

3. Das Experiment: Der unsichtbare Zaubertrick

Um das zu beweisen, hat Cain ein kleines Experiment gemacht:

Er trainierte einen einfachen KI-Koch, um Zahlen zu erkennen (z. B. Ziffern von 0 bis 9).
Dann nahm er die "Zutaten-Mischungen" in der Mitte des Kochs und streckte sie mathematisch wie einen Gummiballon (eine invertierbare lineare Transformation).
Er passte den letzten Schritt des Kochs so an, dass er die Verzerrung wieder ausglich.

Das Ergebnis:

Die KI machte keinen einzigen Fehler mehr. Sie sagte immer noch "Das ist eine 7".
Aber wenn man sich ansah, wie "ähnlich" die verschiedenen Zahlen im Inneren der KI waren, sah die Welt völlig anders aus!
Die "Nachbarn" (ähnliche Zahlen) waren plötzlich nicht mehr die gleichen. Eine 3 könnte plötzlich näher an einer 8 sein als an einer 5, nur weil man die Landkarte verzerrt hatte.

4. Was bedeutet das für uns?

Das ist eine wichtige Warnung für alle, die KI-Forschung betreiben:

Wir können nicht einfach auf die Form vertrauen: Wenn wir sagen "Diese KI-Modelle sind ähnlich", müssen wir vorsichtig sein. Vielleicht sehen sie nur deshalb ähnlich aus, weil wir sie in denselben Koordinaten gemessen haben.
Der "Weißwasch"-Effekt (Whitening): Cain schlägt vor, eine Art "Standardmaßstab" zu verwenden. Stell dir vor, du nimmst deine verzerrte Landkarte und drückst sie so lange, bis sie wieder perfekt rund ist (die Verzerrung entfernt). Das nennt man "Whitening". Wenn man das tut, bekommt man eine faire, unverzerrte Sicht auf die Daten.
Die wahre Essenz: Die wahre Intelligenz der KI liegt nicht in den Winkeln oder Abständen auf dem Papier, sondern darin, wie sie die Informationen verarbeitet. Wir müssen Methoden finden, die unabhängig davon sind, wie wir die Landkarte zeichnen.

Fazit

Die Arbeit von Jericho Cain sagt uns: Vertraue nicht blind auf die Form der Daten.

Neuronale Netze sind wie Chameleons. Sie können ihre Farbe (die Koordinaten ihrer inneren Welt) ändern, ohne ihre Identität (die Vorhersage) zu verlieren. Wenn wir versuchen, diese Netze zu verstehen, müssen wir aufpassen, dass wir nicht die Farbe des Chamäleons analysieren, sondern das Wesen dahinter. Wir müssen lernen, die Verzerrungen zu ignorieren oder sie zu korrigieren, um die wahre Struktur der KI zu sehen.

Es ist ein Aufruf, die KI nicht nur nach dem zu bewerten, wie sie aussieht, sondern danach, was sie tut – und zwar unabhängig davon, in welchem "Maßsystem" wir sie gerade betrachten.

Each language version is independently generated for its own context, not a direct translation.

Titel: Eichfreiheit und metrikabhängige Abhängigkeiten in Räumen neuronaler Repräsentationen

1. Problemstellung

In der Analyse neuronaler Netze werden interne Repräsentationen (z. B. Hidden States, Embeddings) häufig als Vektoren in einem festen euklidischen Raum behandelt. Es wird oft implizit angenommen, dass die Koordinaten dieser Vektoren eine intrinsische geometrische Bedeutung tragen. Ähnlichkeitsmaße wie die Kosinus-Ähnlichkeit oder der euklidische Abstand werden standardmäßig verwendet, um semantische Beziehungen, Clusterstrukturen oder die Anisotropie von Embedding-Räumen zu analysieren.

Das Paper identifiziert jedoch ein fundamentales Problem: Die Koordinaten neuronaler Repräsentationen sind nicht eindeutig definiert. Wenn eine versteckte Repräsentation $h(x)$ durch eine invertierbare lineare Abbildung $D$ transformiert wird, kann die Netzwerkausfunktion exakt erhalten bleiben, indem die nachfolgenden Gewichte $W$ entsprechend angepasst werden ( $W' = W D^{-1}$ ). Da die Netzwerkfunktion unverändert bleibt, sind die Repräsentationen nur bis auf die Wirkung der allgemeinen linearen Gruppe $GL(d)$ definiert. Dies wird als Eichfreiheit (Gauge Freedom) der Repräsentationsräume bezeichnet.

Die zentrale Frage ist: Wie beeinflusst diese Eichfreiheit metrikabhängige Größen wie die Kosinus-Ähnlichkeit? Die Arbeit argumentiert, dass solche Maße nicht invariant unter diesen Transformationen sind und daher keine intrinsischen Eigenschaften des Modells, sondern Artefakte der gewählten Koordinatendarstellung sein können.

2. Methodik und theoretischer Rahmen

Der Autor behandelt Repräsentationsräume als Vektorräume, die nur bis auf invertierbare lineare Transformationen definiert sind.

Eichsymmetrie (Gauge Symmetry):
Für eine Repräsentation $h(x)$ und eine lineare Schicht $y = W h(x)$ gilt für jede invertierbare Matrix $D \in GL(d)$ :
$\tilde{h}(x) = D h(x), \quad \tilde{W} = W D^{-1}$
Daraus folgt $\tilde{W}\tilde{h}(x) = W h(x) = y$ . Die Netzwerkfunktion bleibt identisch, obwohl die Koordinaten der Repräsentation sich ändern.
Metrik und Ähnlichkeit:
Die Kosinus-Ähnlichkeit $\cos(u, v) = \frac{u^\top v}{\|u\|\|v\|}$ setzt eine euklidische Metrik voraus. Unter einer Transformation $h \to Dh$ ändert sich die induzierte Metrik zu $G = D^\top D$ . Die Kosinus-Ähnlichkeit wird dann zu einer gewichteten Form:
$\cos_D(u, v) = \frac{u^\top G v}{\sqrt{u^\top G u}\sqrt{v^\top G v}}$
Dies zeigt, dass lineare Verzerrungen die Winkelbeziehungen im Raum verändern, obwohl die kodierten Informationen gleich bleiben.
Whitening als kanonische Eichung:
Als Lösung wird das „Whitening" vorgeschlagen. Durch Transformation mit $D = \Sigma^{-1/2}$ (wobei $\Sigma$ die Kovarianzmatrix der Repräsentationen ist) wird die Verteilung isotrop ( $E[\tilde{h}\tilde{h}^\top] = I$ ). Dies definiert eine kanonische Eichung, in der die Kosinus-Ähnlichkeit einer Winkelähnlichkeit in einem Raum mit unitärer Kovarianz entspricht.
Experimentelles Design:
Um den Effekt zu isolieren, wurden kontrollierte Experimente durchgeführt:
1. Training eines Modells (MLP oder CNN).
2. Extraktion der Repräsentationen einer versteckten Schicht.
3. Anwendung einer invertierbaren linearen Transformation $D$ auf die Repräsentationen.
4. Kompensation durch Anpassung der finalen Klassifikator-Gewichte ( $W' = W D^{-1}$ ).
5. Vergleich der Geometrie (Kosinus-Ähnlichkeit, Nachbarschaftsstruktur) vor und nach der Transformation, während die Vorhersagen des Modells konstant gehalten wurden.

3. Wichtige Beiträge

Formalisierung der Eichfreiheit: Das Paper etabliert den Begriff der Eichsymmetrie in neuronalen Repräsentationsräumen und zeigt, dass viele gängige Analysemethoden (PCA, Clustering, Kosinus-Ähnlichkeit) eichabhängig sind.
Erklärung von Phänomenen in der Literatur: Es liefert eine einheitliche Erklärung für beobachtete Instabilitäten der Kosinus-Ähnlichkeit, Anisotropie in Embedding-Räumen und die Notwendigkeit von Methoden wie SVCCA oder CKA, die versuchen, eichinvariante Vergleiche durchzuführen.
Unterscheidung von Modell- vs. Koordinateneigenschaften: Es wird argumentiert, dass Analysen zwischen Eigenschaften der Netzwerkfunktion (invariant) und Eigenschaften der Koordinatendarstellung (eichabhängig) unterscheiden müssen.
Verbindung zur Feature-Superposition: Die Arbeit zeigt, dass die Geometrie der Feature-Überlagerung (Superposition) nicht nur von der Anzahl der Features abhängt, sondern von der metrikabhängigen Überlappungsstruktur der Feature-Richtungen, die durch die Eichwahl beeinflusst wird.

4. Ergebnisse

Experimente an einem Multilayer-Perceptron (auf dem Digits-Datensatz) und einem kleinen CNN (auf CIFAR-10) bestätigten die theoretischen Vorhersagen:

Funktionsinvarianz: Nach der Transformation und Gewichts-Kompensation blieben die Vorhersagen des Modells unverändert (Übereinstimmung 1.0, maximale Logit-Differenz $\approx 10^{-5}$ ).
Verzerrung der Kosinus-Ähnlichkeit: Trotz gleicher Vorhersagen änderte sich die Kosinus-Ähnlichkeit zwischen Repräsentationen signifikant.
- Im Digits-Experiment betrug die mittlere absolute Änderung der Kosinus-Ähnlichkeit $|\Delta \cos| \approx 0.13$ .
- Im CIFAR-10-Experiment war die Änderung geringer ( $\approx 0.05$ ), aber dennoch systematisch vorhanden.
Instabilität der Nachbarschaftsstruktur: Die Struktur der nächsten Nachbarn (k-NN) änderte sich drastisch.
- Bei $k=10$ betrug die Jaccard-Überlappung der Nachbarschaftsmengen nur ca. 0.72 (d.h. ca. 28% der nächsten Nachbarn änderten sich).
- Bei stärkeren Transformationen (höhere Konditionszahl $\kappa$ der Matrix $D$ ) nahm die Instabilität zu. Bei $\kappa=20$ flippten ca. 37% der Top-1-Nachbarn.
Whitening-Effekt: Die Anwendung von Whitening reduzierte die Anisotropie der Kovarianzmatrix effektiv auf die Identität und stellte eine kanonische Referenz her.

5. Bedeutung und Implikationen

Die Ergebnisse haben weitreichende Konsequenzen für die Interpretierbarkeit und Analyse neuronaler Netze:

Kritik an Kosinus-Ähnlichkeit: Kosinus-Ähnlichkeit ist keine intrinsische Eigenschaft gelernt Repräsentationen. Sie hängt stark von der gewählten Koordinatendarstellung ab. Schlussfolgerungen über semantische Ähnlichkeit basierend auf Kosinus-Metriken müssen daher mit Vorsicht gezogen werden, da sie durch die Eichwahl verzerrt sein können.
Notwendigkeit eichinvarianter Methoden: Analysen sollten entweder auf Größen fokussieren, die unter $GL(d)$ invariant sind (z. B. Subraum-Überlappungen, CKA, CCA), oder explizit eine kanonische Eichung (wie Whitening) wählen, um vergleichbare Ergebnisse zu erhalten.
Verständnis von Trainingsdynamik: Die Arbeit verbindet die Geometrie des Trainings mit der Eichabhängigkeit. Optimierung induziert bevorzugte Richtungen im Repräsentationsraum, aber die Metrik, mit der diese Richtungen gemessen werden, ist eichabhängig.
Praktische Empfehlung: Empirische Studien zur Geometrie neuronaler Repräsentationen sollten die Eichabhängigkeit explizit berücksichtigen. Das Berichten von Ergebnissen unter einer kanonischen Eichung oder die Verwendung linear-invarianter Vergleichsmethoden bietet eine stabilere Basis für die Interpretation.

Zusammenfassend stellt das Paper fest, dass neuronale Repräsentationsräume geometrische Objekte sind, die nur bis auf invertierbare lineare Transformationen definiert sind. Die explizite Berücksichtigung dieser Eichfreiheit führt zu einer saubereren und robusteren Interpretation der Geometrie neuronaler Netze.

Gauge Freedom and Metric Dependence in Neural Representation Spaces

Das Geheimnis der unsichtbaren Koordinaten: Warum die Form von KI-Daten trügerisch ist

1. Der Trick mit dem Maßstab (Die "Gauge-Freiheit")

2. Der falsche Kompass: Die Kosinus-Ähnlichkeit

3. Das Experiment: Der unsichtbare Zaubertrick

4. Was bedeutet das für uns?

Fazit

Titel: Eichfreiheit und metrikabhängige Abhängigkeiten in Räumen neuronaler Repräsentationen

1. Problemstellung

2. Methodik und theoretischer Rahmen

3. Wichtige Beiträge

4. Ergebnisse

5. Bedeutung und Implikationen

Mehr davon

DyMRL: Dynamic Multispace Representation Learning for Multimodal Event Forecasting in Knowledge Graph

How unconstrained machine-learning models learn physical symmetries

Experiential Reflective Learning for Self-Improving LLM Agents

Learning Mesh-Free Discrete Differential Operators with Self-Supervised Graph Neural Networks

Physics-Informed Neural Network Digital Twin for Dynamic Tray-Wise Modeling of Distillation Columns under Transient Operating Conditions