SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

Dit artikel introduceert SpHOR, een nieuwe aanpak voor open-set herkenning die via toezichtgeleerde representaties, orthogonale label-embeddings, sferische beperkingen en Mixup/Label Smoothing de kenmerkruimte optimaliseert om onbekende klassen effectiever te identificeren dan bestaande methoden.

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge

Gepubliceerd 2026-02-24
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme, digitale arts hebt die gespecialiseerd is in het herkennen van vijf soorten huidkanker. Deze arts is getraind op duizenden foto's van die vijf specifieke soorten. In de echte wereld werkt dit echter niet altijd zo simpel. Wat gebeurt er als de arts een foto ziet van een zesde, onbekende soort huidkanker die hij nooit heeft gezien?

Een standaard computerprogramma (een 'gesloten' systeem) zou proberen die onbekende ziekte te forceren in één van de vijf bekende categorieën. Het zou zeggen: "Dit is zeker type 3!" en een fout maken. Dat is gevaarlijk.

Open-Set Recognition (OSR) is de oplossing: het systeem moet durven zeggen: "Ik weet niet wat dit is, dit is een onbekend type."

De auteurs van dit paper, SpHOR, hebben een nieuwe manier bedacht om deze 'digitale arts' slimmer te maken. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: De "Vertrouwensval"

Stel je voor dat je een museum hebt met een zaal voor "Hond" en een zaal voor "Kat".

  • Grote verschuiving: Als er een foto van een auto in de zaal valt, is dat makkelijk te herkennen. Het past er niet bij.
  • Kleine verschuiving (Het echte probleem): Wat als er een foto van een wolf in de zaal valt? Een wolf lijkt op een hond. Een standaard AI denkt: "Oh, dit is een hond!" en valt in de vertrouwensval. Het is te zeker van zijn zaak, terwijl het eigenlijk een onbekend dier is.

De oude methoden leerden de AI om alles in de bekende dozen te proppen. SpHOR doet iets anders: het bouwt eerst een perfecte kaart van de wereld voordat het de dozen (de klassen) erop zet.

2. De Oplossing: SpHOR (De Slimme Kaartbouwer)

SpHOR werkt in twee stappen, net als het bouwen van een stad voordat je de huizen erin zet.

Stap 1: Het Bouwen van de Sfeer (De Kogel)

In plaats van een platte kaart (zoals een gewone computergeheugenruimte), bouwen ze een kogel (een bol).

  • De Regel: Alle bekende dingen (honden, katten) moeten op het oppervlak van deze kogel liggen.
  • De Orthogonaliteit (De Rechte Hoek): Stel je voor dat elke soort dier een eigen straal heeft die uit het midden van de kogel komt. Bij SpHOR zorgen ze ervoor dat deze stralen perfect haaks op elkaar staan. Een hond-straal raakt de kat-straal nooit. Dit zorgt ervoor dat ze heel ver uit elkaar liggen, zelfs als ze op elkaar lijken.
  • De Mengeling (Mixup & Gladdering): Tijdens het leren maken ze "tussen-dingen". Ze nemen een foto van een hond en een kat, en maken er een wazige, gemengde foto van. De AI moet leren dat dit gemengde ding geen van beide is, maar ergens in het "lege ruimte" tussen de stralen ligt. Dit helpt de AI om de grenzen van de bekende dozen scherper te definiëren en de lege ruimte (waar onbekende dingen wonen) groter te maken.

Stap 2: De Wacht (De Classifier)

Pas nadat de kogel en de stralen perfect zijn opgebouwd, zetten ze de "wachters" (de klassificatiekop) erop. Omdat de kaart al zo goed is, hoeft de wachter niet hard te werken om de grenzen te trekken; ze liggen er al.

3. Waarom werkt dit zo goed?

De auteurs hebben twee nieuwe meetlatjes bedacht om te zien of het werkt:

  1. De Hoek-maat (Angular Separability): Hoe ver staan de bekende dingen uit elkaar? Bij SpHOR staan ze ver uit elkaar, zodat een wolf (die ergens tussenin zit) niet per ongeluk in de honden-doos valt.
  2. De Kracht-maat (Norm Separability): Hoe sterk is de "zekerheid"? Onbekende dingen krijgen een zwakker signaal. Als de AI iets ziet dat niet op de kogel past, zegt het systeem: "Ik voel me hier niet zeker over, dit is onbekend."

4. Het Resultaat

Wanneer ze dit testen op moeilijke taken (zoals het onderscheiden van heel specifieke vogelsoorten of auto's), wint SpHOR het van alle andere methoden.

  • Het maakt veel minder fouten bij het herkennen van onbekende dingen.
  • Het is zelfs beter als de computer niet is voorgeprogrammeerd met kennis van de hele wereld (zonder "pre-training").
  • Het werkt sneller en efficiënter dan de huidige top-methoden.

Kort samengevat:
Standaard AI's proberen alles in bekende vakjes te proppen, ook als het er niet in past. SpHOR bouwt eerst een ruimte waar de bekende dingen ver uit elkaar staan en waar er veel "lege ruimte" is voor onbekende dingen. Als er iets onbekends binnenkomt, past het niet in een vakje en valt het in die lege ruimte. Dan zegt de AI: "Ik weet het niet," in plaats van een gevaarlijke gok te wagen.

Dit is een enorme stap voor veiligheid, bijvoorbeeld in medische diagnoses of zelfrijdende auto's, waar het herkennen van "iets wat we niet kennen" net zo belangrijk is als het herkennen van wat we wel kennen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →