Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een grote bibliotheek organiseert. Je hebt een lijst met boeken die je kent (bijvoorbeeld "Kookboeken", "Reisgidsen" en "Detectiveverhalen"). Maar terwijl je de boeken sorteert, duiken er ook boeken op waarvan je niet weet wat ze zijn: misschien een boek in een vreemde taal, een oud dagboek, of een handleiding voor een apparaat dat nog niet bestaat.

In de wereld van kunstmatige intelligentie (AI) noemen we deze onbekende boeken "open-set" data. Het probleem is dat de AI, als ze niet goed wordt begeleid, deze vreemde boeken vaak per ongeluk probeert in te delen bij de bekende categorieën, of juist helemaal negeert. Dit maakt de AI verward en minder slim.

Dit papier introduceert een nieuwe methode genaamd E2OAL. Het is als een slimme bibliothecaris die twee dingen doet: hij leert van de vreemde boeken én hij kiest slim uit welke boeken hij eerst laat nakijken door een mens.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het oude probleem: De "Goochelaar" en de "Vergeten Hoek"

Vroeger hadden AI-systemen een lastige truc nodig. Ze hadden een aparte "detective" nodig die moest kijken: "Is dit boek wel een kookboek?" Als de detective niet zeker was, werd het boek weggegooid of als "onbekend" gemarkeerd.

Het nadeel: Het kostte veel tijd om die detective te trainen. En nog belangrijker: als je eenmaal wist dat een boek "onbekend" was, keek de AI er vaak niet meer naar. Alsof je een vreemd dagboek in de hoek gooit en vergeet dat er misschien interessante verhalen in staan die je wél kunt gebruiken om beter te leren over de bekende boeken.

2. De nieuwe oplossing: E2OAL (De Slimme Bibliothecaris)

De auteurs van dit papier zeggen: "Wacht even, die onbekende boeken zijn niet nutteloos! Ze hebben een eigen structuur."

Stel je voor dat je een groep vreemde boeken hebt. In plaats van ze allemaal in één grote hoop "Onbekend" te gooien, kijkt de AI: "Zie ik hier patronen? Zien deze drie vreemde boeken eruit alsof ze bij elkaar horen? En die andere twee?"

De drie magische stappen van E2OAL:

Stap 1: De "Onbekenden" groeperen (Clustering)

De AI gebruikt een speciale bril (een voorgeprogrammeerd systeem dat al veel heeft gezien) om naar de boeken te kijken. Zelfs als ze geen titel hebben, ziet de AI: "Ah, deze drie vreemde boeken lijken op elkaar, en die twee andere lijken weer op iets anders."

De analogie: Het is alsof je een doos met losse Lego-blokken krijgt. Je weet niet wat je moet bouwen, maar je ziet wel dat er rode blokken, blauwe blokken en wieltjes zijn. Je groepeert ze op kleur en vorm. Dit helpt de AI om de structuur van de wereld beter te begrijpen, zelfs voor dingen die ze niet kent.

Stap 2: Leren van de "Onbekenden" (Calibratie)

In plaats van die groepen vreemde boeken te negeren, gebruikt de AI ze als extra oefenmateriaal.

De analogie: Stel je voor dat je een kok bent die alleen Italiaanse gerechten kent. Plotseling krijg je een recept voor een onbekend Aziatisch gerecht. In plaats van het weg te gooien, zegt de kok: "Oké, dit is niet pasta, maar ik zie dat er ook kruiden en vuur bij komen. Dit helpt me om te begrijpen hoe 'kruiden' werken in het algemeen."
De AI leert hierdoor beter te onderscheiden tussen wat ze wel kent en wat ze niet kent. Ze wordt minder zelfverzekerd over dingen die ze niet begrijpt (een veelvoorkomend probleem bij AI).

Stap 3: Slimme Selectie (De Vraagstrategie)

Nu de AI slimmer is, moet ze beslissen: "Welke boeken laat ik nu aan de mens zien om te labelen?"
Ze wil niet zomaar willekeurige boeken vragen, en ze wil zeker niet de vreemde boeken vragen die ze toch niet kan categoriseren.

De "Reinheid" (Purity): De AI kijkt eerst: "Is dit boek waarschijnlijk een kookboek?" Als het antwoord "misschien" is, maar de kans is groot, dan is het een goede kandidaat.
De "Nuttigheid" (Informativeness): Vervolgens kijkt ze: "Is dit boek interessant?" Als het boek heel duidelijk een kookboek is, weet de AI dat al. Als het boek heel duidelijk geen kookboek is, wil ze dat ook niet weten. Ze zoekt het boekje dat "net op de rand" zit: een beetje twijfelachtig, maar wel interessant genoeg om te leren.
De Analogie: Het is alsof je een quizvraagt stelt. Je wilt niet vragen: "Is dit een appel?" (als het duidelijk een appel is) en je wilt niet vragen: "Is dit een auto?" (als het duidelijk een auto is). Je vraagt: "Is dit een aardbei of een tomaat?" Want daar leer je het meest van.

Waarom is dit zo geweldig?

Efficiëntie: Je hoeft geen aparte "detective" te trainen. De AI doet alles in één keer. Dat bespaart tijd en rekenkracht.
Leren van alles: De AI gebruikt de "onbekende" boeken als extra lesmateriaal in plaats van ze als vuilnis te behandelen.
Betrouwbare keuzes: De AI vraagt de mens alleen om boeken die echt nuttig zijn om te labelen, en vermijdt het vragen van boeken die de AI toch niet kan begrijpen.

Kortom:
E2OAL is een slimme manier om AI te trainen in een wereld vol verrassingen. Het leert de AI om niet bang te zijn voor het onbekende, maar om die onbekende dingen te gebruiken om nog slimmer te worden in wat ze wel kent. Het is alsof je een student niet alleen laat studeren voor het examen, maar ook laat nadenken over de vragen die niet op het examen staan, zodat ze de stof beter begrijpen.

Each language version is independently generated for its own context, not a direct translation.

1. Probleemstelling

Open-Set Active Learning (OSAL) richt zich op het selecteren van informatieve samples voor annotatie in scenario's waar de ongelabelde data mogelijk klassen bevat die niet voorkwamen in de trainingsset (zogenaamde "unknowns" of out-of-distribution data). Dit is een veelvoorkomend probleem in veiligheidskritieke toepassingen zoals autonoom rijden en medische diagnose.

Bestaande OSAL-methoden hebben twee belangrijke beperkingen:

Afhankelijkheid van aparte detectoren: Ze vertrouwen vaak op apart getrainde "Out-of-Distribution" (OOD) detectoren om onbekende klassen te identificeren. Dit introduceert aanzienlijke trainingskosten en complexiteit.
Onderschatting van gelabelde unknowns: Wanneer onbekende samples toch worden gelabeld (bijv. als "onbekend"), worden deze vaak genegeerd of samengevoegd tot één enkele klasse. Bestaande methoden missen de potentie om de latente structuur van deze onbekende klassen te gebruiken als waardevolle supervisie om de prestaties van de bekende klassen te verbeteren.

2. Methodologie: E2OAL Framework

De auteurs stellen E2OAL (Effective and Efficient Open-set Active Learning) voor, een unified, detector-vrij framework dat onbekende samples omzet in zowel sterkere supervisie als informatieve query's. Het proces verloopt in twee fasen per actieve leer-rond:

Fase 1: Adaptieve Classificatie en Calibratie

Label-gestuurde Clustering: In een bevroren, contrastief voorgetrainde feature-ruimte (bijv. CLIP of MoCo) worden alle gelabelde samples (bekend + onbekend) geklaust.
- Het framework schat automatisch het aantal onbekende klassen ( $\hat{u}$ ) door een F1-product doelstelling te maximaliseren via een ternary search. Dit onthult de latente structuur van de onbekende data zonder vooraf kennis van het aantal klassen.
Dirichlet-gebaseerde Calibratie: Een auxiliary head wordt toegevoegd die zowel bekende als geschatte onbekende klassen modelleert.
- In plaats van standaard softmax, wordt een Dirichlet-calibratie gebruikt. Dit doorbreekt de translatie-invariantie van softmax (waarbij logit-verschuivingen de waarschijnlijkheid niet veranderen), wat leidt tot overmoedige voorspellingen.
- Door het gebruik van Evidential Deep Learning (EDL), wordt de onzekerheid gemodelleerd als een Dirichlet-verdeling. Dit verbetert de discriminatie van bekende klassen en levert betrouwbaardere betrouwbaarheidsschattingen op.

Fase 2: Flexibele Query-Selectie (Twee-staps strategie)

Om te voorkomen dat onbekende samples per ongeluk worden geselecteerd, gebruikt E2OAL een tweestapsstrategie:

High-Purity Candidate Pool:
- Er wordt een Logit-Margin Purity Score ( $S_{purity}$ ) berekend voor elke ongelabelde sample. Deze score meet het verschil tussen de hoogste logit van een bekende klasse en de hoogste logit van een onbekende klasse.
- Een Gaussian Mixture Model (GMM) wordt gebruikt om samples te sorteren op puurheid. Een kandidatenpool wordt samengesteld die voldoet aan een doel-query-puurheid ( $p^*$ ).
- Een adaptief mechanisme past de drempel dynamisch aan op basis van de geobserveerde puurheid van de vorige ronde, zonder extra hyperparameters.
Informativiteits-selectie:
- Binnen de zuivere kandidatenpool worden de meest informatieve samples geselecteerd.
- Er wordt een Jensen-Shannon (JS) divergentie-maatstaf gebruikt die samples met matige onzekerheid prioriteert. Dit vermijdt zowel te duidelijke (triviale) samples als te onzekere (mogelijk onbekende) samples.

3. Belangrijkste Bijdragen

Unified, Detector-vrij Framework: E2OAL elimineert de noodzaak voor aparte OOD-detectoren, wat de trainingskosten verlaagt en de efficiëntie verhoogt.
Uitbuiting van Gelabelde Unknowns: Het paper demonstreert dat het behouden van de fijne granulariteit van onbekende klassen (in plaats van ze als één blok te behandelen) de prestaties van bekende klassen significant verbetert.
Dirichlet-Calibratie en Purity Scoring: De introductie van een Dirichlet-gebaseerde auxiliary head en een logit-margin puurheidsscore zorgt voor robuustere onzekerheidsschattingen en betere selectie van bekende klassen.
Adaptieve Query-Strategie: Een dynamisch aangepaste tweestapsstrategie die een vastgestelde doel-puurheid bereikt zonder handmatige tuning van drempels.

4. Resultaten

De auteurs hebben E2OAL getest op meerdere benchmarks (CIFAR-10, CIFAR-100, Tiny-ImageNet) met verschillende verhoudingen van bekende vs. onbekende klassen (mismatch ratios).

Prestatie: E2OAL overtreft consistent state-of-the-art methoden (zoals EAOA, BUAL, EOAL) in zowel testnauwkeurigheid als query-efficiëntie.
Query Puurheid: Het framework behoudt een hoge query-puurheid (aandeel bekende klassen in de geselecteerde batch) die dicht bij de doelwaarde ligt, terwijl het voorkomt dat onbekende samples worden geselecteerd.
Efficiëntie: Door het verwijderen van aparte detectoren is de totale trainings tijd vergelijkbaar met lichtgewicht baselines, maar met aanzienlijk betere resultaten.
Ablatie-studies: Experimenten tonen aan dat elk onderdeel (clustering, Dirichlet-calibratie, puurheidsscore, informativiteitsmeting) essentieel is voor de algehele prestaties. Het gebruik van gelabelde unknowns levert een extra prestatieboost op ten opzichte van methoden die deze negeren.

5. Betekenis en Impact

Dit paper biedt een paradigmaverschuiving in Open-Set Active Learning. Het toont aan dat "unknowns" niet slechts ruis zijn die moet worden geweerd, maar waardevolle signalen die de leercurve van bekende klassen kunnen versnellen als ze correct worden gemodelleerd.

Praktische Toepasbaarheid: De detector-vrije aard maakt het framework zeer geschikt voor real-world toepassingen waar rekenkracht beperkt is en data continu verandert (open-world scenarios).
Robuustheid: De methode is robuust tegen verschillende mismatch-ratios en vereist weinig hyperparameter-tuning, wat het een praktische oplossing maakt voor complexe classificatietaken in dynamische omgevingen.

Kortom, E2OAL lost het dilemma op tussen het selecteren van informatieve samples en het vermijden van onbekende klassen, door de onbekende data zelf te integreren in het leerproces in plaats van ze als obstakel te behandelen.