Incremental dimension reduction for efficient and accurate visual anomaly detection

Deze paper introduceert een incrementeel dimensiereductie-algoritme dat door het verwerken van beelden in batches en het updaten van singuliere waarden, de training van visuele anomaliedetectiemodellen versnelt zonder significant in te leveren op de nauwkeurigheid.

Teng-Yok Lee

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme bibliotheek hebt met miljoenen foto's van perfecte producten, zoals een fabriek die duizenden perfecte hamers of broodjes produceert. Je doel is om in een nieuwe foto direct te zien: "Aha! Hier is er eentje die niet klopt!" (bijvoorbeeld een hamer met een kras of een broodje dat platgedrukt is). Dit noemen we visuele anomaliedetectie.

Vroeger deden computers dit door elke foto in duizenden kleine stukjes te knippen en elk stukje te analyseren met een zeer slimme, maar zware "AI-brein" (een diep neuronaal netwerk). Het probleem? Dit AI-brein is zo slim dat het voor elk stukje foto een enorme lijst met getallen maakt (een vector) om te beschrijven hoe het eruit ziet.

Het Probleem: De Overvolle Koffer

Stel je voor dat je voor elke foto een koffer moet vullen met deze lijsten van getallen. Als je duizenden foto's hebt, heb je duizenden zware koffers.

  • De ruimte: Je computergeheugen (RAM) is als een kleine auto. Je kunt niet duizenden zware koffers in één keer in die auto proppen.
  • De snelheid: Om te controleren of een nieuwe foto goed is, moet de computer elke nieuwe koffer vergelijken met alle oude koffers. Dat is als proberen elke nieuwe bezoeker in een drukke club te vergelijken met elke persoon die er ooit is geweest. Het duurt eeuwen.

De beste bestaande methode (PatchCore) probeert dit op te lossen door maar een klein deel van de koffers te bewaren, maar zelfs dat is soms te veel of te traag.

De Oplossing: De Slimme Samenvatting

De auteur van dit paper, Teng-Yok Lee, heeft een slimme truc bedacht: Incrementele Dimensiereductie.

Laten we dit uitleggen met een analogie:

1. De "Groepsfoto" aanpak (Batches)

In plaats van alle duizenden koffers tegelijk te proberen te verwerken (wat de auto platdrukt), doet de computer dit in groepen (batches).

  • Hij pakt eerst 100 koffers.
  • Dan nog 100.
  • Dan nog 100.

2. De "Samenvatting" (SVD)

Voor elke groep van 100 koffers maakt de computer een slimme samenvatting.
Stel je voor dat je een groep van 100 mensen hebt. In plaats van hun volledige biografieën (1000 pagina's per persoon) te bewaren, maak je een kort profiel van 5 regels dat de belangrijkste kenmerken van de hele groep samenvat.

  • De computer doet dit met wiskunde (Singular Value Decomposition, of SVD). Hij haalt de "ruis" en de onbelangrijke details weg en houdt alleen de kern van de informatie over.
  • Dit is alsof je van een 4K-foto een scherpe, maar veel kleinere JPEG maakt. De details zijn er nog steeds, maar de bestandsgrootte is enorm kleiner.

3. Het "Opbouwen" zonder alles opnieuw te doen

Hier is de echte genialiteit van deze methode:
Bij oude methoden moest je, zodra je een nieuwe groep koffers toevoegde, alle oude samenvattingen opnieuw berekenen. Dat is als elke keer dat je een nieuw lid aan je club toevoegt, alle oude leden hun profiel opnieuw moeten schrijven. Dat is veel te traag.

Deze nieuwe methode doet het anders:

  • Hij werkt de samenvatting van de nieuwe groep bij met de oude samenvatting.
  • Hij slaat de oude, zware gegevens direct weer op (of verwijdert ze) en houdt alleen de compacte samenvattingen bij.
  • Pas aan het einde, als alle groepen zijn verwerkt, zet hij alle kleine samenvattingen weer in één groot, perfect overzicht.

Waarom is dit geweldig?

  1. Snelheid: Omdat de computer niet hoeft te wachten tot alle data er is, en niet alles opnieuw hoeft te berekenen, gaat het trainen van het systeem veel sneller.
  2. Geheugen: Je hebt geen supercomputer nodig om de data te bewaren. De "koffers" zijn nu zo klein dat ze in een gewone laptop passen, zelfs als je duizenden foto's hebt.
  3. Nauwkeurigheid: Het mooie is dat de computer de foto's niet "verkeerd" begrijpt. De samenvatting is zo slim gemaakt dat de computer nog steeds precies weet wat een perfecte hamer is en wat een gebroken hamer is. De nauwkeurigheid blijft bijna hetzelfde als bij de zware, trage methode.

Conclusie

Dit paper presenteert een manier om een zeer slimme, maar zware AI te "verkleinen" terwijl hij leert. Het is alsof je een enorme bibliotheek van boeken omzet in een set van slimme samenvattingenkaarten. Je kunt nu sneller zoeken, je hebt minder ruimte nodig, en je vindt nog steeds precies wat je zoekt. Hierdoor kunnen fabrieken met duizenden foto's van producten eindelijk snel en goedkoop defecten opsporen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →