Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

Each language version is independently generated for its own context, not a direct translation.

Das Problem: Der spezialisierte Bibliothekar

Stellen Sie sich einen sehr gut ausgebildeten Bibliothekar vor (das ist die künstliche Intelligenz, oder das „Modell"). Dieser Bibliothekar hat jahrelang nur in einer einzigen, sehr spezifischen Abteilung gearbeitet: der Abteilung für alte Landkarten.

Er kennt jede Landkarte, jeden Fluss und jedes Gebirge auf diesen Karten auswendig. Wenn Sie ihm eine neue Landkarte zeigen, kann er sofort sagen: „Das ist eine Karte von Deutschland" oder „Das ist eine Karte von Italien". Er ist ein Meister darin, Unterschiede innerhalb seiner Abteilung zu erkennen.

Das Problem tritt auf, wenn Sie ihm etwas anderes geben:

Ein neues Buch: Sie zeigen ihm ein Buch über Astronomie.
Ein neues Foto: Sie zeigen ihm ein Foto von einem Hund.

Der Bibliothekar ist so darauf trainiert, nur Landkarten zu sehen, dass er das Astronomie-Buch oder den Hund nicht als „fremd" erkennt. Er versucht verzweifelt, sie als eine Art Landkarte zu interpretieren. Er sagt: „Na ja, der Hund sieht aus wie eine sehr abstrakte Karte von einem Flussdelta." Er fällt auf den Betrug herein, weil er keine Ahnung hat, dass er sich außerhalb seines Fachgebiets befindet.

In der Wissenschaft nennen wir das Out-of-Distribution (OOD) Detection: Die Fähigkeit eines KI-Systems zu erkennen, wenn etwas völlig Neues oder Fremdes aufgetaucht ist, das es nicht kennt.

Die Ursache: Der „Kollaps" der Sinne

Die Forscher haben herausgefunden, warum dieser Bibliothekar so blind ist.

Wenn man einen KI-Modell nur auf einer einzigen Art von Daten trainiert (z. B. nur Landkarten), passiert etwas Merkwürdiges mit seinem „Gehirn" (den mathematischen Merkmalen, die es speichert):

Es lernt extrem gut, die Unterschiede zwischen den Landkarten zu sehen (z. B. Fluss A vs. Fluss B).
Aber es löscht alle anderen Informationen, die nicht direkt mit dem Klassifizieren der Landkarten zu tun haben. Es vergisst den Papierstil, die Farbe des Papiers, die Art der Tinte oder den Hintergrund.

Stellen Sie sich vor, der Bibliothekar hat sich einen blinden Fleck zugelegt. Er sieht nur noch die Form der Linien, aber nicht den Kontext. Wenn ein Astronomie-Buch hereinkommt, hat es keine Linien, die wie Landkarten aussehen. Da der Bibliothekar aber alles andere „heruntergefahren" hat, um sich auf die Landkarten zu konzentrieren, kann er das Buch nicht als „fremd" identifizieren. Er sieht es einfach als „falsche Landkarte".

Die Forscher nennen dieses Phänomen „Domain-Sensitivity Collapse" (Kollaps der Domänen-Sensitivität). Das Modell wird so spezialisiert, dass es seine Fähigkeit verliert, zu merken, dass es sich in einer anderen Welt befindet.

Die Lösung: Der „Lehrer" mit dem breiten Horizont

Wie repariert man das? Die Forscher haben eine clevere Methode namens Teacher-Guided Training (TGT) entwickelt.

Stellen Sie sich vor, wir holen einen zweiten Bibliothekar hinzu. Dieser zweite Bibliothekar ist ein Allrounder. Er hat nicht nur Landkarten gesehen, sondern auch Astronomie-Bücher, Hundefotos, Kochbücher und Musiknoten. Er kennt den Unterschied zwischen „Landkarte" und „Nicht-Landkarte" perfekt.

Der Trick beim Training:

Wir lassen den spezialisierten Bibliothekar (den Schüler) weiter an den Landkarten arbeiten, damit er seine Hauptaufgabe (Landkarten erkennen) gut macht.
Aber während er arbeitet, schauen wir ihm über die Schulter. Der Allrounder-Bibliothekar (der Lehrer) sagt ihm: „Hey, schau mal, dieses Bild hat zwar Linien, aber es fühlt sich anders an als eine Landkarte. Es hat einen anderen 'Vibe'."
Wichtig: Der Lehrer sagt dem Schüler nicht, wie er die Landkarten klassifizieren soll. Er sagt ihm nur: „Achte auf die Dinge, die nicht zur Landkarte gehören."

Der Schüler lernt also, die Landkarten zu erkennen, behält aber gleichzeitig ein offenes Ohr für den „Vibe" der Welt (den Kontext). Er lernt, dass ein Astronomie-Buch anders aussieht als eine Landkarte, nicht weil es eine andere Landkarte ist, sondern weil es gar keine Landkarte ist.

Das Ergebnis: Besser ohne mehr Arbeit

Das Geniale an dieser Methode ist:

Während des Trainings: Der Schüler lernt von dem Allrounder-Lehrer.
Nach dem Training: Wir werfen den Lehrer weg! Der Schüler arbeitet allein. Er braucht den Lehrer nicht mehr, um zu arbeiten.
Im Einsatz: Der Schüler ist jetzt viel schlauer. Wenn ihm ein Astronomie-Buch gezeigt wird, denkt er nicht: „Das ist eine komische Landkarte", sondern: „Das passt hier nicht hin!" und warnt uns.

Zusammengefasst:
Die Forscher haben gezeigt, dass KI-Modelle, die nur auf einer Sache trainiert werden, oft „blind" für alles andere werden. Indem sie während des Trainings einen „Allrounder-Lehrer" an die Seite stellen, der ihnen hilft, die Welt um sie herum zu verstehen, werden sie viel besser darin, Fremdes zu erkennen – ohne dass sie danach langsamer oder komplizierter werden.

Es ist wie ein Musiker, der nur klassische Musik spielt, aber durch einen Mentor lernt, auch Jazz zu hören. Wenn dann plötzlich Rockmusik aufkommt, weiß er sofort: „Das ist nicht mein Genre", statt zu versuchen, den Rocksong in eine klassische Symphonie umzuwandeln.

Each language version is independently generated for its own context, not a direct translation.

1. Problemstellung: Das Versagen in Single-Domain-Szenarien

Out-of-Distribution (OOD)-Detektion zielt darauf ab, Eingabedaten zu identifizieren, die nicht aus der Trainingsverteilung stammen. Während bestehende Methoden auf Benchmarks mit vielfältigen Domänen (z. B. CIFAR-10/100, ImageNet) gut funktionieren, scheitern sie oft in Single-Domain-Szenarien (z. B. Histopathologie, Satellitenbilder, industrielle Inspektion).

In diesen Szenarien werden Modelle auf Daten trainiert, die alle denselben visuellen Kontext, dieselbe Sensorik und denselben Stil teilen. Die Autoren identifizieren einen fundamentalen geometrischen Fehlermechanismus, den sie Domain-Sensitivity Collapse (DSC) nennen:

Mechanismus: Das überwachende Training (Supervised Learning) auf Single-Domain-Daten drängt die Repräsentationen in einen niedrig-rangigen, klassen-diskriminativen Unterraum (Class Subspace).
Folge: Richtungen im Merkmalsraum, die für Domänenunterschiede (Domain-Shift) relevant sind, werden unterdrückt, da sie für die Klassentrennung innerhalb der Domäne als irrelevant angesehen werden.
Kritische Schwäche: Herkömmliche OOD-Scores (sowohl distanzbasiert wie MDS, kNN als auch logit-basiert wie MSP, Energy) verlieren ihre Sensitivität gegenüber Domänenverschiebungen, da die relevanten Signale in den „Nullraum" (Null Space) der Merkmalsdarstellung kollabieren.

2. Methodik: Teacher-Guided Training (TGT)

Um das DSC-Problem zu lösen, stellen die Autoren Teacher-Guided Training (TGT) vor. Dies ist ein Trainingsansatz, der während des Trainingszeitraums Wissen von einem vortrainierten, eingefrorenen Multi-Domain-Modell in das Student-Modell überträgt, ohne die Inferenzkosten zu erhöhen.

Kernkomponenten:

Teacher-Modell: Ein eingefrorenes, vortrainiertes Foundation-Modell (DINOv2 ViT-S/14), das reichhaltige, domänensensitive Merkmale besitzt, aber keine Klassen-diskriminativen Strukturen für die spezifische Single-Domain-Aufgabe gelernt hat.
Class-Suppressed Teacher Residuals: Der entscheidende Trick besteht darin, die klassen-diskriminativen Richtungen des Teachers zu entfernen.
1. Berechnung der Klassenmittelwerte des Teachers.
2. Projektion der Teacher-Merkmale auf den orthogonalen Komplementraum zu diesen Klassenmittelwerten.
3. Das Ergebnis ist ein „Residual", das reine Domänen-, Stil- und Erfassungsinformationen (Domain-Shift-Signale) enthält, aber keine Klasseninformation.
Auxiliary Loss: Während des Trainings des Student-Modells wird ein zusätzlicher Verlustterm ( $\mathcal{L}_{domain}$ ) eingeführt. Dieser zwingt den Student, die class-supprimierten Residuen des Teachers vorherzusagen (mittels eines kleinen auxiliary Heads).
Ziel: Die Kombination aus dem Standard Cross-Entropy-Loss (für die Klassifizierung) und dem Domain-Residual-Loss (für die Domänensensitivität) erzwingt eine Merkmalsdarstellung, die sowohl klassen-diskriminativ als auch domänensensitiv ist.

Inferenz: Nach dem Training werden der Teacher und der auxiliary Head verworfen. Das deployte Modell ist das reine Student-Modell. Es entstehen keine zusätzlichen Inferenzkosten.

3. Wichtige Beiträge

Formalisierung von Domain-Sensitivity Collapse (DSC): Die Autoren definieren DSC als eine Hauptursache für das Versagen von OOD-Detektoren in Single-Domain-Settings. Sie liefern theoretische Beweise, die zeigen, wie die Anisotropie der Merkmalsverteilung (hohe Varianz nur im Klassen-Unterraum) zu einem Versagen von Distanz- und Logit-basierten Scores führt.
Entwicklung von TGT: Ein neuer Trainingsansatz, der die Geometrie der Repräsentation wiederherstellt, indem er domänensensitive Struktur von einem Multi-Domain-Teacher distilliert, ohne OOD-Daten während des Trainings zu benötigen.
Umfassende Validierung: Die Methode wurde auf acht verschiedenen Single-Domain-Benchmarks (z. B. Colon, Tissue, EuroSAT, Fashion) evaluiert und zeigt konsistente Verbesserungen.

4. Ergebnisse

Die Evaluation erfolgte auf acht Benchmarks mit ResNet-50 und DINOv2 als Backbones. Die Metrik war die False Positive Rate bei 95% True Positive Rate (FPR@95).

Verbesserung bei Distanz-basierten Scores: TGT erzielt massive Verbesserungen bei Distanz-basierten OOD-Scorern (MDS, ViM, kNN).
- Im Durchschnitt über alle 8 Benchmarks (ResNet-50) sank die FPR@95 für MDS um 11,61 Prozentpunkte, für ViM um 10,78 pp und für kNN um 12,87 pp.
- Dies stellt einen erheblichen Schritt in Richtung der Leistung eines „Teacher-Feature-Orakels" dar.
In-Domain vs. Out-of-Domain: TGT verbessert die OOD-Erkennung sowohl für Out-of-Domain (andere visuelle Domäne) als auch für In-Domain OOD (neue Klassen innerhalb derselben Domäne), ohne die Klassifikationsgenauigkeit signifikant zu beeinträchtigen.
Geometrische Analyse: Die Messungen zeigen, dass TGT den effektiven Rang (Effective Rank) der Merkmalskovarianz signifikant erhöht (z. B. von ~5 auf ~12 bei Colon-Daten) und die Varianz wieder in die für die Domänenerkennung wichtigen Richtungen verteilt.
Vergleich mit SupCon: Supervised Contrastive Learning (SupCon) konnte das DSC-Problem nicht zuverlässig lösen und performte schlechter als TGT.

5. Bedeutung und Fazit

Das Paper unterstreicht, dass zuverlässige OOD-Detektion in Single-Domain-Systemen primär ein Repräsentationslernproblem und nicht nur ein Problem der Score-Funktion ist.

Paradigmenwechsel: Es zeigt, dass reines Cross-Entropy-Training in homogenen Domänen die für die OOD-Erkennung notwendigen Informationen löscht.
Praktische Relevanz: Da viele reale Anwendungen (Medizin, Industrie) Single-Domain-Daten nutzen, bietet TGT eine effiziente Lösung, die keine OOD-Daten zum Training benötigt und keine Laufzeit-Overheads verursacht.
Zukunftsausblick: Die Arbeit legt den Grundstein für das Verständnis der Geometrie von neuronalen Netzen in spezialisierten Domänen und schlägt vor, dass die Integration von Multi-Domain-Wissen (via Teacher) essenziell ist, um die Robustheit von KI-Systemen in der Praxis zu gewährleisten.

Zusammenfassend demonstriert TGT, dass durch gezieltes „Reparieren" der Merkmalsgeometrie während des Trainings die Lücke zwischen theoretischer OOD-Leistung und praktischer Anwendbarkeit in spezialisierten Domänen geschlossen werden kann.

Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

Das Problem: Der spezialisierte Bibliothekar

Die Ursache: Der „Kollaps" der Sinne

Die Lösung: Der „Lehrer" mit dem breiten Horizont

Das Ergebnis: Besser ohne mehr Arbeit

1. Problemstellung: Das Versagen in Single-Domain-Szenarien

2. Methodik: Teacher-Guided Training (TGT)

3. Wichtige Beiträge

4. Ergebnisse

5. Bedeutung und Fazit

Mehr davon

Faster Stochastic Algorithms for Minimax Optimization under Polyak--Łojasiewicz Conditions

Tensor Completion Leveraging Graph Information: A Dynamic Regularization Approach with Statistical Guarantees

Federated Multi-Agent Mapping for Planetary Exploration

Random Scaling and Momentum for Non-smooth Non-convex Optimization

Exploring Low-Dimensional Subspaces in Diffusion Models for Controllable Image Editing