Geometrically Constrained Outlier Synthesis

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du hast einen sehr klugen, aber manchmal etwas zu selbstbewussten Schüler. Dieser Schüler hat gelernt, verschiedene Hunderassen zu erkennen (z. B. Golden Retriever, Dackel, Pudel). Wenn er ein Foto eines Golden Retrieters sieht, sagt er: „Das ist ein Golden Retriever!" – und das ist richtig.

Das Problem entsteht, wenn man ihm ein Foto von einem Labrador zeigt, den er nie gesehen hat. Ein normaler, untrainierter KI-Modell würde trotzdem mit 100-prozentiger Sicherheit sagen: „Das ist ein Golden Retriever!" Es ist sich so sicher, dass es den Fehler nicht merkt. Das ist gefährlich, besonders wenn es um Dinge wie medizinische Diagnosen oder autonomes Fahren geht.

Die Forscher Daniil Karzanov und Marcin Detyniecki haben eine neue Methode namens GCOS (Geometrically Constrained Outlier Synthesis) entwickelt, um diesem Schüler beizubringen, wann er unsicher sein sollte.

Hier ist die Erklärung in einfachen Worten mit ein paar kreativen Vergleichen:

1. Das Problem: Der Schüler kennt nur die Grenzen des Klassenzimmers

Bisherige Methoden versuchten, dem Schüler künstliche „Fremde" vorzustellen, damit er lernt, sie zu erkennen. Aber oft waren diese Fremden entweder:

Zu offensichtlich: Wie ein Alien in einem Raum voller Menschen. Der Schüler denkt sofort: „Das ist kein Mensch!" (Das lernt er nicht viel daraus).
Zu ähnlich: Wie ein Doppelgänger, der kaum zu unterscheiden ist. Der Schüler wird verwirrt und verliert sein Vertrauen.

2. Die Lösung: GCOS – Der „Geometrische Architekt"

GCOS ist wie ein cleverer Architekt, der den Schüler nicht einfach nur Fremde zeigt, sondern ihm beibringt, wie der Raum (die Welt der Daten) eigentlich aussieht.

Stell dir vor, die Daten (die Bilder) liegen auf einer unsichtbaren, gekrümmten Oberfläche, wie auf einem Hügel oder einer Welle. Die echten Hunde (die Daten, die der Schüler kennt) liegen alle auf diesem Hügel.

Der Trick: GCOS sucht nach den kleinsten, kaum sichtbaren Rillen auf diesem Hügel. Es ist wie ein Bergsteiger, der genau weiß, wo das Gestein instabil ist.
Die Synthese: Anstatt willkürlich Steine zu werfen, platziert GCOS künstliche „Fremde" (Outlier) genau dort, wo die Welle des Hügels sanft in die Tiefe abfällt. Diese Punkte sind noch nah genug am Hügel, um interessant zu sein, aber weit genug entfernt, um zu zeigen: „Hier enden unsere Regeln."

3. Der „Sicherheitsgürtel" (Die konforme Schale)

Wie weit soll der Schüler diese künstlichen Fremden denn nun platzieren? Zu nah? Zu weit?
Hier kommt ein cleverer Trick aus der Statistik ins Spiel, den die Autoren eine „konforme Schale" nennen.

Die Analogie: Stell dir vor, du hast eine Gruppe von Freunden (die Trainingsdaten). Du misst, wie weit sie sich normalerweise voneinander entfernen können, ohne dass es komisch wirkt.
Die Schale: GCOS baut einen unsichtbaren Ring um diese Gruppe.
- Wenn ein neuer Punkt innerhalb des Rings liegt, ist er wahrscheinlich noch ein Freund (eine bekannte Hunderasse).
- Wenn er außerhalb liegt, ist er ein Fremder.
- Das Geniale: GCOS platziert die künstlichen Fremden genau auf diesem Ring. So lernt der Schüler, dass die Welt nicht schwarz-weiß ist, sondern dass es eine klare Grenze gibt, an der er sagen muss: „Ich bin mir nicht sicher, das passt nicht hierher."

4. Warum ist das besser als vorherige Methoden?

Frühere Methoden (wie VOS) haben oft einfach angenommen, dass die Welt wie eine perfekte Kugel aussieht (eine Gauß-Verteilung). Aber die echte Welt ist unregelmäßig wie ein zerklüftetes Gebirge.

GCOS versteht die Form des Gebirges. Es weiß, dass manche Hunderassen (z. B. im Bild „Stanford Dogs") sehr ähnlich aussehen und eng beieinander liegen, während andere weit entfernt sind.
Es passt die künstlichen Fremden also perfekt an die Form der echten Daten an. Das Ergebnis: Der Schüler wird viel besser darin, echte „Fremde" (Out-of-Distribution) zu erkennen, ohne dabei die echten Freunde zu verwechseln.

5. Das Ergebnis: Ein sicherer Schüler

In Tests hat sich gezeigt, dass dieser Ansatz (GCOS) viel besser funktioniert als alle bisherigen Methoden, besonders bei schwierigen Fällen, wo die „Fremden" den echten Daten sehr ähnlich sehen (z. B. ein Labrador, der wie ein Golden Retriever aussieht).

Zusammenfassend:
GCOS ist wie ein Lehrer, der einem KI-Modell nicht nur die richtigen Antworten gibt, sondern ihm auch beibringt, wo die Grenzen seines Wissens liegen. Es baut eine unsichtbare Mauer um das, was das Modell kennt, und lehrt es, genau an dieser Mauer aufzuhören, sich sicher zu fühlen, wenn etwas Neues kommt. Das macht KI-Systeme viel zuverlässiger und sicherer für die echte Welt.

Each language version is independently generated for its own context, not a direct translation.

1. Problemstellung

Deep Neural Networks (DNNs) für die Bildklassifizierung neigen dazu, bei Out-of-Distribution (OOD) Daten übermäßig selbstbewusst (overconfident) zu sein. Das bedeutet, dass Eingaben, die nicht zu den Trainingsklassen gehören, oft fälschlicherweise mit hoher Wahrscheinlichkeit einer bekannten Klasse zugeordnet werden.

Bestehende Methoden zur Lösung dieses Problems, wie z. B. die Virtual Outlier Synthesis (VOS), generieren synthetische OOD-Daten, um das Modell zu trainieren, diese zu erkennen. Allerdings haben diese Ansätze zwei wesentliche Nachteile:

Vereinfachte Annahmen: Sie gehen oft von einfachen Verteilungen (z. B. Gauß-Verteilungen) außerhalb des Datenmanifolds aus, was die komplexe, oft nicht-gaußsche Struktur realer Anomalien nicht abbildet.
Fokus auf „Far-OOD": Viele Benchmarks testen nur Fälle, bei denen OOD-Daten semantisch weit entfernt sind (z. B. Tierklassifizierung vs. Industrieprodukte). Die kritischere Herausforderung ist jedoch die Near-OOD-Erkennung, bei der OOD-Daten derselben übergeordneten Domäne angehören, aber feine Unterschiede aufweisen (z. B. verschiedene Hunderassen oder medizinische Pathologien). Hier sind die Merkmale sehr ähnlich, was zu katastrophalen Fehlern führen kann.

2. Methodik: Geometrically Constrained Outlier Synthesis (GCOS)

GCOS ist ein Regularisierungsframework, das während des Trainings virtuelle OOD-Beispiele im versteckten Merkmalsraum (hidden feature space) generiert. Der Kernansatz besteht darin, die synthetisierten Ausreißer so zu platzieren, dass sie die gelernte Mannigfaltigkeitsstruktur der In-Distribution (ID)-Daten respektieren, aber gezielt in Bereiche führen, die für das Modell schwer zu unterscheiden sind.

Der Prozess läuft in zwei Hauptphasen ab:

A. Geometrische Identifikation von Richtungen (PCA)

Anstatt Daten zufällig zu generieren, nutzt GCOS eine Hauptkomponentenanalyse (PCA) auf den Merkmalsvektoren der Trainingsdaten:

Es werden die Eigenvektoren und Eigenwerte der Kovarianzmatrix der ID-Daten berechnet.
Die Hauptkomponenten werden in „große" (hohe Varianz, liegen auf dem Datenmanifold) und „kleine" (geringe Varianz, liegen senkrecht zum Manifold) unterteilt.
Die kleinen Hauptkomponenten repräsentieren Richtungen mit geringer Variabilität. Bewegungen in diese Richtungen erzeugen Punkte, die statistisch unwahrscheinlich sind, aber dennoch in der Nähe des Datenzentrums liegen. Dies sind die idealen Richtungen für die Synthese von „schwierigen" OOD-Beispielen.

B. Konformale Shell-Synthese (Conformal Shell)

Um die Schwierigkeit der synthetisierten Ausreißer zu steuern (weder zu einfach noch zu nah an den echten Daten), wird ein heuristischer Ansatz inspiriert durch Konformale Vorhersage (Conformal Prediction) verwendet:

Es wird eine Kalibrierungsdatenmenge verwendet, um die Verteilung eines Nonconformity-Scores (z. B. Mahalanobis-Distanz oder Energy-Score) zu ermitteln.
Basierend auf den empirischen Quantilen (z. B. 95. und 99. Perzentil) wird eine „konforme Schale" (conformal shell) definiert.
Der Skalierungsfaktor $\alpha$ für die Bewegung entlang der kleinen Eigenvektoren wird so gewählt, dass die synthetisierten Punkte innerhalb dieser Schale liegen.
Ergebnis: Die generierten OOD-Punkte sind „harte Negative": Sie sind nicht trivial zu erkennen, aber auch nicht so nah an den ID-Daten, dass sie ununterscheidbar sind.

C. Regularisierungsverlust

Die synthetisierten OOD-Punkte werden in einen kontrastiven Regularisierungsverlust ( $L_{reg}$ ) integriert:

Das Ziel ist es, die Nicht-Konformitäts-Scores der ID-Daten zu minimieren und die Scores der synthetisierten OOD-Daten zu maximieren.
Dies fördert die Trennbarkeit zwischen ID und OOD im Merkmalsraum, oft unter Verwendung von Energy-basierten Scores oder Mahalanobis-Distanzen.

3. Wichtige Beiträge

Neuartige geometrische Synthese: Ersetzung parametrischer Verteilungsannahmen durch eine geometriegetriebene Methode, die die lokale Struktur des Merkmalsraums nutzt (PCA auf kleinen Varianzen).
Konformale Heuristik für die Synthese: Einführung eines adaptiven Mechanismus zur Bestimmung der „Strangeness" (Fremdartigkeit) synthetischer Daten mittels Quantilen, um eine optimale Schwierigkeit für das Training zu gewährleisten.
Fokus auf Near-OOD: Das Framework wurde explizit für Near-OOD-Szenarien entwickelt, wo semantische Ähnlichkeiten bestehen, und zeigt dort signifikante Verbesserungen gegenüber dem State-of-the-Art.
Erweiterung zu Konformaler Inferenz: Als explorative Erweiterung wird gezeigt, wie das Framework in eine konforme Hypothesentestung überführt werden kann, um OOD-Erkennung mit formalen statistischen Fehlergarantien (p-Werte) zu ermöglichen.

4. Ergebnisse

Die Autoren evaluieren GCOS auf vier Near-OOD-Datensätzen:

Colored MNIST: Ziffern mit variierenden Farben (OOD sind falsche Farb-Ziffer-Kombinationen).
Stanford Dogs: Klassifizierung von Hunderassen (OOD sind ähnliche, aber nicht trainierte Rassen).
MVTec AD: Industrielle Anomalieerkennung (Defekte vs. intakte Objekte).
Retinopathy: Augenerkrankungen (verschiedene Schweregrade vs. andere Pathologien).

Ergebnisse im Vergleich zum State-of-the-Art (z. B. VOS, Dream-OOD, NCIS, MSP):

Überlegene Leistung: GCOS erreicht auf allen Datensätzen die höchste durchschnittliche AUROC (93,47 %) und AUPR.
Reduzierte False Positives: GCOS erzielt deutlich niedrigere FPR95-Werte (False Positive Rate bei 95% True Positive Rate) als alle Vergleichsmethoden. Beispielsweise liegt der FPR95 bei Colored MNIST bei nur 1,00 % (VOS: 18,50 %, keine Regularisierung: 32,50 %).
Visualisierung: UMAP-Projektionen zeigen, dass GCOS die Entscheidungsgrenzen enger um die Datencluster legt und OOD-Punkte in den „schwierigen" Regionen zwischen Clustern generiert, während VOS-Punkte oft nur am Rand der Cluster liegen.
Effizienz: Im Gegensatz zu diffusion-basierten Methoden (wie Dream-OOD) ist GCOS rechnerisch effizienter, da es keine aufwendige Generierung im Pixelraum erfordert.

5. Bedeutung und Ausblick

Die Arbeit demonstriert, dass die Berücksichtigung der geometrischen Struktur des Merkmalsraums entscheidend für robuste OOD-Erkennung ist, insbesondere bei Near-OOD-Aufgaben, die in sicherheitskritischen Anwendungen (Medizin, autonomes Fahren) relevant sind.

Robustheit: Durch die Erzeugung von Ausreißern, die die Mannigfaltigkeit respektieren, lernt das Modell, Unsicherheiten besser zu kalibrieren und ist weniger anfällig für übermäßiges Vertrauen bei unbekannten Eingaben.
Formale Garantien: Der Brückenschlag zu konformer Inferenz bietet einen Weg, um OOD-Erkennung nicht nur als heuristischen Score, sondern als statistisch validierten Test mit kontrollierbaren Fehlerraten zu etablieren. Dies ist ein wichtiger Schritt hin zu verlässlicheren KI-Systemen.
Zukunft: Die Autoren schlagen vor, diese Techniken weiter zu entwickeln, um Modelle zu schaffen, die inhärent Unsicherheiten quantifizieren können, was besonders in Domänen wie der Medizin von hoher Bedeutung ist.

Zusammenfassend stellt GCOS einen Paradigmenwechsel dar: weg von der Annahme einfacher Verteilungen hin zu einer datengetriebenen, geometrisch fundierten Synthese von Ausreißern, die die Grenzen des gelernten Wissens präzise auslotet.