PRISM: Diversifying Dataset Distillation by Decoupling Architectural Priors

PRISM is een nieuw framework voor datasetdistillatie dat de inductieve bias van een enkel model doorbreekt door logit-afstemming en regularisatie te ontkoppelen en te superviseren met diverse architecturen, wat leidt tot synthetische data met een hogere intra-klassediversiteit en betere generalisatie op ImageNet-1K.

Brian B. Moser, Shalini Sarode, Federico Raue, Stanislav Frolov, Krzysztof Adamkiewicz, Arundhati Shanbhag, Joachim Folz, Tobias C. Nauen, Andreas Dengel

Gepubliceerd 2026-02-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Wat is het probleem? (De "Eenzame Leraar")

Stel je voor dat je een kunstenaar wilt leren schilderen. Je geeft hem een boek met 1.000 foto's van katten en vraagt hem om er een paar nieuwe, perfecte kattenfoto's van te maken, zodat hij later kan oefenen.

De meeste bestaande methoden (zoals SRe2L) doen dit door één enkele leraar te gebruiken. Stel, die leraar is een fotograaf die alleen houdt van oranje katten met een zachte blik.

  • Omdat de kunstenaar alleen naar die ene leraar kijkt, gaan alle nieuwe katten die hij schildert eruitzien als oranje, zachte katten.
  • Ze hebben allemaal hetzelfde uiterlijk. Er is geen variatie.
  • Als je deze kunstenaar later een echte, zwarte, harige kat laat zien, raakt hij in de war. Hij heeft immers alleen maar geleerd van die ene, saaie oranje leraar.

In de wereld van kunstmatige intelligentie noemen we dit homogeniteit: de gegenereerde data is te eentonig en mist de rijkdom van de echte wereld.

Wat is de oplossing? (PRISM: De "Meesterklas")

De auteurs van dit paper hebben een nieuwe methode bedacht, genaamd PRISM. De naam staat voor PRIors from diverse Source Models (Voorkeuren van diverse bronmodellen).

In plaats van één leraar, gebruiken ze een meesterklas met verschillende experts.

Stel je voor dat je niet één leraar hebt, maar een panel van drie:

  1. De Logistieke Meester: Deze kijkt alleen naar de vorm en de naam van de kat ("Dit is een kat").
  2. De Kleur-Expert: Deze kijkt naar de textuur en de sfeer ("Dit moet er natuurlijk uitzien").
  3. De Sfeer-Meester: Deze kijkt naar de details en de achtergrond.

Het geheim van PRISM:
Ze splitsen de taak op.

  • De Logistieke Meester zegt: "Zorg dat het een kat is."
  • De Kleur-Expert (een heel ander type model) zegt: "Zorg dat de vacht er natuurlijk uitziet."

Door deze twee verschillende "meningen" of architecturale voorkeuren te combineren, ontstaat er een nieuwe kat die niet alleen een kat is, maar ook een unieke, natuurlijke vacht heeft. Omdat ze verschillende experts gebruiken, ontstaan er veel meer verschillende soorten katten (zwart, wit, harig, glad), in plaats van alleen maar oranje exemplaren.

Hoe werkt het precies? (De "Twee Hoeden")

In de technische taal van het paper doen ze dit door twee doelen te scheiden:

  1. Logits (De naam): Welk dier is het? Dit wordt geleerd van Model A.
  2. Batch Normalisatie (De sfeer): Hoe ziet het eruit? Dit wordt geleerd van Model B.

Vroeger deed één model beide dingen. Dat betekende dat de "naam" en de "sfeer" altijd van hetzelfde perspectief kwamen. PRISM zegt: "Nee, laten we Model A vragen om de naam te controleren, en Model B vragen om de sfeer te controleren."

Dit zorgt ervoor dat de gegenereerde beelden veel diverser zijn. Ze lijken minder op elkaar, net zoals echte katten dat doen.

Wat levert dit op? (De Resultaten)

De auteurs hebben dit getest op een enorme dataset met foto's van 1.000 verschillende dingen (ImageNet-1K).

  • Beter leren: Als je een AI traint op de "PRISM-katten", presteert die AI veel beter op echte, nieuwe katten dan als je traint op de "saaie oranje katten".
  • Meer variatie: Als je de gegenereerde foto's bekijkt, zie je dat ze veel meer variëren in kleur, textuur en houding. Ze zijn niet allemaal hetzelfde.
  • Schaalbaar: Het werkt zelfs heel goed als je duizenden foto's per categorie wilt maken, wat voorheen erg moeilijk was.

Samenvatting in één zin

PRISM is een slimme manier om kunstmatige data te maken door niet naar één leraar te luisteren, maar door een team van verschillende experts te laten samenwerken, zodat de gegenereerde beelden veel natuurlijker, gevarieerder en beter bruikbaar zijn voor het trainen van slimme computers.

Het is alsof je van een saaie, grijze muur (de oude methode) een kleurrijk mozaïek maakt (PRISM) door verschillende kunstenaars met verschillende stijlen aan het werk te zetten.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →