Ranked Activation Shift for Post-Hoc Out-of-Distribution Detection

Die Arbeit stellt „Ranked Activation Shift" vor, eine hyperparameterfreie Nachbearbeitungsmethode zur robusten Erkennung von Out-of-Distribution-Daten, die durch den Ersatz sortierter Aktivierungsmagnituden durch ein festes Referenzprofil die Instabilität bestehender skalenbasierter Ansätze überwindet und dabei die Klassifizierungsgenauigkeit erhält.

Gianluca Guglielmo, Marc Masana

Veröffentlicht 2026-04-13
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das Problem: Der verwirrte KI-Koch

Stellen Sie sich eine künstliche Intelligenz (KI) wie einen erfahrenen Koch vor, der jahrelang nur italienische Gerichte gelernt hat. Er kann Pizza und Pasta perfekt erkennen. Aber was passiert, wenn jemand ihm plötzlich einen Sushi oder eine Tacos auf den Teller legt?

Der Koch ist verwirrt. Da er Sushi und Tacos nie gesehen hat, versucht er trotzdem, sie als "Pasta" zu klassifizieren, weil er sich unsicher ist. Er ist sich zu 99 % sicher, dass es Pasta ist – aber er liegt komplett falsch. Das ist das Problem der Out-of-Distribution (OOD)-Erkennung: Die KI muss merken, wenn etwas völlig Neues vor ihr liegt, statt blindlings eine falsche Antwort zu geben.

Die bisherigen Lösungen: Der "Schere-und-Kleber"-Ansatz

Bisherige Methoden, um diese KI zu warnen, funktionieren wie ein Schere-und-Kleber-System:

  • Sie schauen sich die "Gedanken" der KI (die Aktivierungen) an.
  • Wenn ein Wert zu hoch ist (wie ein lauter Schrei des Kochs), wird er einfach abgeschnitten (wie mit einer Schere).
  • Oder sie versuchen, die Werte zu skalieren (wie mit einem Vergrößerungsglas), um sie besser zu vergleichen.

Das Problem dabei: Diese Methoden sind sehr empfindlich.

  1. Sie brauchen oft eine Schere, die man genau einstellen muss (Hyperparameter). Ist die Einstellung falsch, schneidet man zu viel oder zu wenig ab.
  2. Sie funktionieren nur gut, wenn die "Gedanken" des Kochs immer positiv sind (wie bei einem Koch, der nur positive Gefühle hat). Aber moderne KIs (wie Vision Transformers) haben auch "negative Gedanken". Wenn man dort mit der Schere schneidet, passiert das Gegenteil von dem, was man will: Die KI wird noch verwirrter.

Die neue Lösung: RAS (Der "Gedächtnis-Check")

Die Autoren schlagen eine neue Methode vor, die sie RAS (Ranked Activation Shift) nennen. Man kann sich das wie einen perfekten Gedächtnis-Check vorstellen.

Statt zu schneiden oder zu skalieren, macht RAS folgendes:

  1. Der Referenz-Check: Zuerst schaut sich die KI an, wie ein "normaler" italienischer Gast (ein bekanntes Bild) aussieht. Sie erstellt eine durchschnittliche Rangliste der "Gedanken" für alle normalen Gerichte. Welcher Gedanke ist am stärksten? Welcher ist am schwächsten? Das ist der Referenz-Plan.
  2. Der Umzug: Wenn nun ein Sushi (ein unbekanntes Bild) hereinkommt, schaut die KI nicht auf die Stärke der Gedanken, sondern auf deren Reihenfolge.
    • Der stärkste Gedanke des Sushis wird genommen und durch den stärksten Gedanken des Referenz-Plans ersetzt.
    • Der zweitstärkste Gedanke wird durch den zweitstärksten Referenz-Gedanken ersetzt.
    • Und so weiter.

Die Analogie:
Stellen Sie sich vor, Sie haben eine Gruppe von Menschen, die nach Größe sortiert sind (der kleinste steht links, der größte rechts).

  • Die alte Methode: Wenn jemand zu groß ist, wird er abgeschnitten oder sein Maßstab verändert. Das funktioniert nicht, wenn die Leute unterschiedliche Körperbau haben.
  • Die RAS-Methode: Wir nehmen die neue Person, sortieren sie nach Größe und lassen sie dann exakt in die Positionen der Referenz-Gruppe rücken. Der Kleinste der neuen Person bekommt die Kleidung des Kleinsten der Referenzgruppe, der Größte die des Größten.

Warum ist das genial?

  1. Keine Schere, kein Kleber: Es gibt keine Einstellungen, die man justieren muss. Die Methode funktioniert "plug-and-play" (einfach einstecken und loslegen).
  2. Funktioniert überall: Ob die KI positive oder negative "Gedanken" hat – egal. Da wir nur die Reihenfolge (den Rang) betrachten und nicht den Wert, funktioniert es bei allen modernen Architekturen (wie ViT oder ConvNeXt), bei denen andere Methoden scheitern.
  3. Die Wahrheit liegt in der Mitte: Die Forscher haben entdeckt, dass man nicht nur laute Gedanken dämpfen muss (inhibieren), sondern auch leise Gedanken lauter machen kann (exzitieren). Beide Richtungen helfen der KI, den Unterschied zwischen "bekannt" und "fremd" zu erkennen. RAS macht beides gleichzeitig.

Das Ergebnis

Die KI wird dadurch wie ein erfahrener Kritiker, der sofort merkt: "Hey, diese Anordnung von Gedanken passt nicht in mein normales Menü." Sie wird nicht verwirrt, sondern sagt: "Das ist kein italienisches Gericht."

Zusammenfassend:
RAS ist wie ein universeller Adapter, der jede fremde Eingabe so umformt, dass sie sich wie ein bekanntes Muster anfühlt. Wenn die KI das Muster nicht wiedererkennen kann, weiß sie sofort: "Hier stimmt etwas nicht!" Und das alles, ohne dass man ihr neue Regeln beibringen oder ihre Einstellungen mühsam justieren muss.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →