The MVTec AD 2 Dataset: Advanced Scenarios for Unsupervised Anomaly Detection

Dit paper introduceert MVTec AD 2, een nieuwe dataset met meer dan 8000 hoogwaardige afbeeldingen van uitdagende industriële inspectiescenario's die zijn ontworpen om de huidige verzadiging in prestaties op bestaande anomaliedetectiebenchmarks te doorbreken en de robuustheid van state-of-the-art methoden te evalueren.

Lars Heckler-Kram, Jan-Hendrik Neudeck, Ulla Scheler, Rebecca König, Carsten Steger

Gepubliceerd 2026-03-11
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een super-scherpe camera hebt die elk product op een fabrieksband moet controleren. Zijn er krassen? Is er een vlekje? Is er iets kapot? Dit heet "anomalie-detectie".

Voorheen hadden onderzoekers een paar bekende sets met foto's (zoals de MVTec AD dataset) om hun computers te trainen. Maar er is een probleem: die sets zijn te makkelijk geworden. Het is alsof je een chess-speler traint met alleen maar beginnerspartijtjes. De beste computers halen nu bijna 100% en scoren bijna identiek. Je kunt niet meer zien wie echt slim is en wie alleen maar een beetje beter is. Het is een "stagnatie".

Daarom hebben de makers van dit nieuwe papier, MVTec Software, een nieuw, veel moeilijker spel bedacht: MVTec AD 2.

Hier is wat ze hebben gedaan, vertaald in alledaags taal:

1. De "Supermarkt van Problemen"

De oude datasets waren als een schone, nette supermarkt waar alles perfect op zijn plek stond. MVTec AD 2 is als een volle, rommelige markt op een regenachtige dag.

  • Doorzichtige en glimmende dingen: Ze hebben foto's gemaakt van flessen en blikjes. Licht reflecteert hierop, waardoor het voor een computer heel lastig is om te zien of er een kras zit of dat het gewoon een lichtflits is.
  • Dingen die op elkaar liggen: Denk aan een bak met walnoten of doppen. Ze liggen niet netjes in een rij, maar liggen over elkaar heen, soms deels buiten beeld. Een computer moet nu kunnen zeggen: "Die kras zit op die specifieke noot, niet op de andere."
  • Zeer kleine foutjes: Soms is het defect zo klein als een stofje op een enorm tapijt. De oude computers zagen dit niet eens, of ze dachten dat het een fout was omdat ze te veel "ruis" zagen.
  • Slecht licht: In de echte fabriek verandert het licht. Soms is het donkerder, soms schijnt er een extra lampje. De oude datasets hadden alleen perfect licht. Dit nieuwe dataset heeft foto's gemaakt met vier verschillende lichtsoorten, zodat de computer moet leren werken in elke weersomstandigheid.

2. De "Onbekende Vijand"

Het belangrijkste idee is onbewaakt leren.
Stel je voor dat je een agent traint om verdachte pakketjes te vinden.

  • Oude methode: Je laat de agent alle verdachte pakketjes zien tijdens de training. Dan weet hij precies wat hij moet zoeken.
  • Nieuwe methode (MVTec AD 2): Je laat de agent alleen de normale, schone pakketjes zien. Hij moet zelf bedenken hoe "normaal" eruit ziet. Als hij dan later een pakketje ziet met een klein krasje, moet hij dat zelf herkennen als "raar".
  • De valstrik: De makers hebben de "antwoorden" (de exacte locaties van de fouten) op de testfoto's verborgen. Je kunt je computer niet zomaar even testen op je eigen laptop. Je moet je resultaten uploaden naar een geheime server (een soort "online examenhal"). De server kijkt dan pas of je het goed hebt gedaan. Dit voorkomt dat mensen "cheaten" door hun computer te trainen op de testvragen.

3. De Resultaten: "Nog niet klaar"

Toen ze de slimste computers van vandaag (de "state-of-the-art" modellen) op deze nieuwe test zetten, gebeurde er iets verrassends:

  • Op de oude, makkelijke tests scoorden ze 90%+.
  • Op deze nieuwe, moeilijke tests (MVTec AD 2) scoorden ze minder dan 60%.
  • Bij de strengste maatstaf (waar je geen enkele fout mag maken, zelfs niet op een heel klein stukje) zakten ze zelfs naar onder de 30%.

Dit betekent: Onze huidige technologie is nog niet klaar voor de echte wereld. Er is nog heel veel ruimte voor verbetering.

4. Waarom is dit belangrijk?

In de echte wereld (zoals bij het maken van medicijnen, auto-onderdelen of chips) mag er geen enkele fout doorheen sluipen.

  • Als je een computer gebruikt die 90% goed doet, betekent dat dat 1 op de 10 producten met een gebrek de fabriek verlaat. Dat is gevaarlijk of duur.
  • Met MVTec AD 2 willen de onderzoekers de wetenschappers dwingen om slimmere, robuustere systemen te bouwen die ook werken als het licht verandert of als de producten rommelig liggen.

Samenvattend in één zin:

De onderzoekers hebben een nieuwe, extreem moeilijke "examenhal" gebouwd voor computers die defecten moeten vinden, omdat de oude examens te makkelijk waren en de computers daar al te goed in waren geworden; nu moeten ze echt bewijzen dat ze kunnen werken in de chaotische, onvoorspelbare echte wereld.