StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

Each language version is independently generated for its own context, not a direct translation.

StructLens: Ein struktureller Blick durch die Linse der KI

Stellen Sie sich vor, ein großes Sprachmodell (wie ein KI-Chatbot) ist wie ein riesiges, mehrstöckiges Bürogebäude. In jedem Stockwerk (jeder „Schicht" des Modells) arbeiten Mitarbeiter, die Informationen verarbeiten. Bisher haben Forscher versucht zu verstehen, wie dieses Gebäude funktioniert, indem sie sich nur die einzelnen Mitarbeiter in einem Raum angesehen haben oder gemessen haben, wie ähnlich sich zwei Mitarbeiter in verschiedenen Stockwerken in ihrer Kleidung (den Daten) waren.

Das Problem dabei: Sie haben übersehen, wie die Mitarbeiter im selben Raum miteinander interagieren und wer mit wem spricht. Sie haben die Struktur des Raumes ignoriert.

Hier kommt StructLens ins Spiel. Es ist wie eine neue Art von Lupe, die nicht nur auf die einzelnen Personen schaut, sondern die Beziehungen zwischen ihnen kartiert.

1. Die Idee: Das Netzwerk der Gedanken

Stellen Sie sich vor, Sie haben einen Satz Wörter. In einem normalen Modell werden diese Wörter einfach nacheinander abgearbeitet. StructLens fragt sich jedoch: „Welches Wort ist das wichtigste für welches andere Wort?"

Die Forscher nutzen dafür einen mathematischen Trick namens Maximaler Spannbaum (Maximum Spanning Tree).

Die Analogie: Stellen Sie sich vor, Sie wollen alle Städte in einem Land mit Straßen verbinden, aber Sie wollen die kürzesten und wichtigsten Straßen bauen, sodass jede Stadt erreichbar ist, ohne unnötige Schleifen.
In der KI bedeutet das: StructLens verbindet alle Wörter in einem Satz so, dass die stärksten semantischen Beziehungen (die „engeren Freundschaften" zwischen Wörtern) im Vordergrund stehen. Das Ergebnis ist ein Baum, der zeigt, wie die KI den Satz gerade „denkt".

2. Was haben sie entdeckt? Die „Inseln"

Als die Forscher diese Bäume von Stockwerk zu Stockwerk verglichen, sahen sie etwas Überraschendes.

Der alte Weg (Cosine Similarity): Früher verglich man Schicht für Schicht wie zwei identische Fotos. Das ergab ein langweiliges, gleichmäßiges Bild.
Der neue Weg (StructLens): Mit StructLens sahen sie Inseln.
- Die Analogie: Stellen Sie sich vor, das Gebäude hat drei verschiedene Zonen. In den unteren Stockwerken (die Basis) arbeiten alle sehr ähnlich. Dann gibt es eine mittlere Zone, in der sich die Arbeitsweise drastisch ändert – hier werden Wörter zu „Chunks" (Blöcken) zusammengefasst. Und ganz oben gibt es wieder eine andere Zone, wo die endgültigen Entscheidungen getroffen werden.
- Diese Zonen sind wie Inseln im Meer der Schichten. Zwischen den Inseln gibt es klare Grenzen, wo sich die Struktur der „Gedankenverbindungen" plötzlich wandelt.

3. Warum ist das wichtig? (Das Schneiden von Ästen)

Das coolste an dieser Entdeckung ist, dass sie praktisch nutzbar ist. Man kann das Modell „beschneiden" (Layer Pruning), um es schneller zu machen, ohne dass es dumm wird.

Die alte Methode: Man schneidet einfach die Schichten weg, die am ähnlichsten aussehen. Das ist wie ein Gärtner, der einfach die Zweige abschneidet, die am meisten Laub haben, ohne zu schauen, ob sie wichtig sind.
Die StructLens-Methode: Man schaut auf die Struktur. Man erkennt: „Aha, diese Schicht hier ist wie ein Gerüst, das wir brauchen, auch wenn es oberflächlich ähnlich aussieht wie die nächste."
Das Ergebnis: Wenn man das Modell mit StructLens schneidet, bleibt es viel schlauer als mit den alten Methoden. Es ist, als würde man einen Baum so beschneiden, dass er immer noch Früchte trägt, aber kleiner und schneller wächst.

Zusammenfassung in einem Satz

StructLens ist wie eine neue Brille für KI-Forscher: Statt nur auf die einzelnen Wörter zu starren, zeigt sie uns das unsichtbare Gerüst aus Beziehungen, das die KI im Inneren aufbaut, und hilft uns, diese KI effizienter und verständlicher zu machen.

Es beweist, dass KI nicht nur eine Aneinanderreihung von Daten ist, sondern eine dynamische Struktur, die sich wie eine Sprache entwickelt – mit eigenen Phasen und Mustern, die wir endlich sehen können.

Each language version is independently generated for its own context, not a direct translation.

1. Problemstellung

Sprache besitzt inhärente Strukturen, die sowohl den Spracherwerb als auch den Sprachwandel erklären. Es wird erwartet, dass Sprachmodelle (LMs) diese strukturellen Eigenschaften auch in ihren internen Repräsentationen widerspiegeln. Bisherige Forschungsansätze zur Interpretierbarkeit und zum Pruning (Schichtenentfernung) von LMs konzentrieren sich jedoch häufig auf:

Lokale Beziehungen: Analysen innerhalb einzelner Schichten oder Module (z. B. Multi-Head Attention).
Token-zu-Token-Vergleiche: Methoden wie die kosinussimilarität vergleichen nur Repräsentationen an korrespondierenden Positionen zwischen Schichten.

Das Defizit: Diese Ansätze vernachlässigen die globalen Beziehungen zwischen den Schichten und die holistischen strukturellen Muster, die sich innerhalb einer Schicht durch die Interaktion aller Token ergeben. Es fehlt ein Framework, das die interne Struktur eines LMs ganzheitlich betrachtet, anstatt nur lokale Ähnlichkeiten zu messen.

2. Methodik: StructLens

Die Autoren stellen StructLens vor, ein analytisches Framework, das die internen Strukturen von LMs durch die Konstruktion von Maximalen Spannbaum-Bäumen (Maximum Spanning Trees, MSTs) entschlüsselt.

Der Ablauf:

Residual Streams: Für jede Schicht $\ell$ des Transformers werden die Residual-Streams $H^{(\ell)}$ (die semantischen Repräsentationen der Token) extrahiert.
Graph-Konstruktion: Für eine Eingabesequenz der Länge $n$ $n$ wird ein vollständig verbundener gerichteter Graph konstruiert.
- Die Knoten entsprechen den Token.
- Die Kantengewichte basieren auf der Ähnlichkeit der semantischen Repräsentationen. Da LMs autoregressiv sind (links-nach-rechts), werden nur Vorwärtskanten ( $i < j$ ) betrachtet.
- Die Ähnlichkeit wird als reziprokes Maß des L2-Abstands berechnet: $g(h_i, h_j) = \frac{1}{1 + \|h_i - h_j\|}$ .
MST-Bildung: Aus diesem Graphen wird ein Maximaler Spannbaum (MST) konstruiert, der alle Knoten verbindet und die Summe der Kantengewichte maximiert. Dies ähnelt dem Dependency Parsing in der NLP, betrachtet aber die impliziten Strukturen im Residual-Stream.
Schichtähnlichkeits-Metriken: Anstatt einfache Kosinussimilarität zu nutzen, berechnet StructLens die Ähnlichkeit zwischen Schichten basierend auf den MST-Eigenschaften:
- Cos-Struct: Kosinussimilarität aggregierter Wurzelrepräsentationen (durch rekursive Mittelung der Subbäume).
- Tree-Edit: Editierdistanz zwischen den MSTs (basierend auf Einfügen, Löschen, Umbenennen von Knoten).
- Edge-Edit: Eine stabilere Metrik, die nur die Differenz der Kantenmengen zwischen zwei Schichten zählt (Vermeidung von Subtree-Verschiebungen).

3. Wichtige Beiträge und Erkenntnisse

A. Entdeckung von „Inseln" (Islands)

Die Analyse der Schichtähnlichkeit mittels Edge-Edit zeigt ein deutliches Muster, das als „Inseln" bezeichnet wird.

Im Gegensatz zur kosinussimilarität, die oft glatte Verläufe zeigt, bilden Edge-Edit-Metriken diskrete Cluster von Schichten mit hoher innerer Ähnlichkeit.
Diese Inseln bleiben über verschiedene Modellgrößen (z. B. Llama3.1 8B vs. 70B) hinweg konsistent.
Interpretation: Diese Inseln repräsentieren Phasen der Informationsverarbeitung. Schichten innerhalb einer Insel arbeiten strukturell ähnlich, während Übergänge zwischen Inseln strukturelle Transformationen markieren.

B. Evolution der Struktur während des Trainings

Durch die Analyse von Checkpoints während des Pre-Trainings (am Beispiel von Olmo2 7B) wurde gezeigt:

In frühen Trainingsphasen sind die „Inseln" in den höheren Schichten groß und unstrukturiert.
Mit fortschreitendem Training verfeinert sich die Struktur: Die Inseln werden kleiner, und die Ähnlichkeit zwischen benachbarten Schichten nimmt zu.
Dies deutet darauf hin, dass das Modell lernt, benachbarte Schichten basierend auf semantischen Strukturen effizienter zu koordinieren.

C. Subtree-Analyse und Token-Verarbeitung

Kontinuierliche Subbäume: In mittleren Schichten neigen Modelle dazu, Token, die im Eingabetext benachbart sind, auch im Embedding-Raum strukturell eng zu gruppieren (hohe Dichte an „contiguous subtrees"). In höheren Schichten werden diese lokalen Cluster wieder aufgelöst, was auf eine Abstraktion hindeutet.
Wiederverwendung von Strukturen: Die Analyse häufiger Subbäume zeigt, dass bestimmte strukturelle Muster in nicht benachbarten Schichten wiederverwendet werden, was auf eine Zusammenarbeit über Schichtgrenzen hinweg hindeutet.

D. Korrelation mit Modellverhalten

Die strukturellen Übergänge (die Grenzen der „Inseln") korrelieren stark mit dem Verhalten des Modells:

Bei Llama3.1 8B markiert der Übergang zur 18. Schicht den Beginn der Fähigkeit, Multiple-Choice-Antworten (A/B/C/D) zu wählen.
Bei Qwen2.5 7B liegt dieser kritische Punkt bei Schicht 22.
Dies beweist, dass strukturelle Transformationen direkt mit dem Übergang von der Sprachverarbeitung zur Aufgabenlösung verknüpft sind.

4. Praktische Anwendung: Layer Pruning

Ein Hauptziel des Papers ist die Demonstration, dass strukturelle Metriken für das Layer Pruning (Entfernen redundanter Schichten) überlegen sind.

Ansatz: Schichten werden basierend auf ihrer „Einflussgröße" (Layer Influence) entfernt. Traditionell wird dies über die kosinussimilarität zwischen aufeinanderfolgenden Schichten berechnet (ShortGPT).
Ergebnis: Die Verwendung von StructLens-Metriken (insbesondere TreeBI und EdgeBI) führt zu einer deutlich besseren Leistungserhaltung nach dem Pruning im Vergleich zur kosinussimilarität.
- Bei Aufgaben wie MMLU und CMMLU erzielten Modelle, die mit TreeBI/EdgeBI gepurrt wurden, höhere Genauigkeiten und niedrigere Perplexity-Werte.
- Dies zeigt, dass strukturelle Redundanz anders definiert ist als einfache Vektorähnlichkeit; Schichten können strukturell unterschiedlich, aber für die Aufgabe dennoch essentiell sein.

5. Bedeutung und Fazit

StructLens bietet einen Paradigmenwechsel in der Analyse von Large Language Models:

Von lokal zu global: Es verschiebt den Fokus von token-basierten oder schichten-internen Analysen hin zu einer globalen, schichten-übergreifenden strukturellen Perspektive.
Erklärungskraft: Es liefert Einblicke in die „Phasen" der Informationsverarbeitung und zeigt, wie Modelle strukturelle Muster während des Trainings entwickeln.
Optimierung: Es beweist, dass strukturelle Metriken (MST-basiert) effektivere Werkzeuge für die Komprimierung von Modellen (Pruning) sind als herkömmliche Ähnlichkeitsmaße.

Zusammenfassend zeigt das Paper, dass die interne Architektur von LMs nicht nur eine Abfolge von Transformationen ist, sondern eine dynamische, strukturierte Evolution, die durch graphentheoretische Methoden wie MSTs besser verstanden und optimiert werden kann. Der Code ist öffentlich verfügbar, um die Reproduzierbarkeit zu gewährleisten.