Iconographic Classification and Content-Based Recommendation for Digitized Artworks

Dit artikel presenteert een proof-of-concept systeem dat kunstwerken automatiseert classificeert en aanbeveelt door YOLOv8-objektdetectie te combineren met de Iconclass-vocabulaire, waarmee de catalogisering en navigatie in grote erfgoedcollecties kan worden versneld.

Krzysztof Kutt, Maciej Baczyński

Gepubliceerd 2026-02-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

🎨 De "Digitale Kunstgids" die de Diepte van Kunst Begrijpt

Stel je voor dat je een enorme, digitale bibliotheek met miljoenen schilderijen hebt. Als je daar een schilderij van een hond opent, kun je meestal alleen zoeken op "hond", "dier" of "17e eeuw". Maar wat als je op zoek bent naar het verhaal achter de hond? Misschien is het een hond die een koning vergezelt, of een hond die in de Bijbel voorkomt?

Normaal gesproken moet een menselijke expert (een kunsthistoricus) dat verhaal uitleggen. Dat kost veel tijd. Dit paper beschrijft een slim computerprogramma genaamd CARIS dat die taak probeert over te nemen. Het is als een digitale assistent die niet alleen wat er op een schilderij staat ziet, maar ook probeert te begrijpen wat het betekent.

Het werkt in vier stappen, alsof je een detective bent die een raadsel oplost:

1. De "Oog" van de Computer (YOLO)

Eerst kijkt de computer naar het schilderij met een zeer scherpe lens (een technologie genaamd YOLO).

  • De analogie: Denk aan een zeer snelle hond die door een kamer rent en roept: "Ik zie een hond! Ik zie een paard! Ik zie een mens!"
  • Het probleem: De computer ziet alleen de objecten. Hij ziet niet dat de hond misschien een "boodschapper" is of dat het paard een "koning" vervoert. Hij ziet alleen de "hond".

2. De "Vertaler" naar een Geheime Code (Iconclass)

Nu komt het slimme deel. De computer gebruikt een enorme, gestructureerde lijst met codes genaamd Iconclass. Dit is als een encyclopedie met een eigen taal voor kunst.

  • De analogie: Stel je voor dat elke mogelijke betekenis in de wereld een eigen telefoonnummer heeft.
    • Nummer 34B11 betekent gewoon "hond".
    • Nummer 94L53 betekent iets heel specifieks: "Hercules' hond proeft een schelp en wordt paars".
  • De computer probeert de woorden die hij zag ("hond", "paard") te koppelen aan deze telefoonnummers. Als hij alleen een hond ziet, krijgt hij een lijst met alle mogelijke telefoonnummers die met "hond" te maken hebben.

3. De "Slimme Redenering" (Het Verhaal Voltooien)

Soms is het verhaal complex. Een "hond" alleen is niet genoeg. Maar als de computer een vrouw met een blinddoek, een weegschaal en een zwaard ziet, begrijpt hij dat dit niet zomaar een vrouw is, maar Justitie.

  • De analogie: Het is alsof je drie losse puzzelstukjes ziet: een blinddoek, een weegschaal en een zwaard. Een slimme persoon (de computer) zegt: "Aha! Als je deze drie samen ziet, is het geen willekeurige vrouw, het is het symbool voor Rechtvaardigheid."
  • Het programma gebruikt een stel regels om deze losse stukjes samen te voegen tot één betekenisvolle code.

4. De "Boekverkoper" (Aanbevelingen)

Tot slot, als je een schilderij hebt gevonden dat je leuk vindt, wil je misschien meer zien dat op hetzelfde niveau zit.

  • De analogie: Stel je voor dat je een boek over "Hercules" leest. Een slimme boekverkoper (het aanbevelingssysteem) zou je niet alleen andere Hercules-boeken geven, maar ook boeken over "Helden" of "Mythologie".
  • Het systeem gebruikt drie verschillende manieren om te beslissen wat je moet zien:
    1. De Familieband: Is het een "neefje" van het schilderij dat je kijkt? (Dezelfde familie, maar niet identiek).
    2. De Zeldzaamheid: Is er een heel zeldzaam detail in het schilderij? Dan is dat een sterke aanwijzing voor een specifiek verhaal.
    3. De Overlap: Hoeveel gedeelde elementen hebben de schilderijen precies?

🚧 Wat gaat er nog mis? (De "Huiswerk" van de Computer)

Het systeem is nog niet perfect, net als een leerling die net begonnen is met studeren.

  • De "Blindheid": Als de computer een hond verward met een beer, denkt hij dat het schilderij over een beer gaat. Dan zijn alle aanbevelingen verkeerd. De computer moet nog veel beter leren kijken.
  • De "Te veel opties": Soms ziet de computer één hond en denkt hij: "Oh, dat kan alles zijn!" en geeft hij duizenden codes. De menselijke expert moet dan nog even "filteren" om de juiste te kiezen.

🌟 De Kernboodschap

De belangrijkste les uit dit onderzoek is: Laat de computer kijken naar de objecten, maar laat de menselijke kennis (de Iconclass-codes) de betekenis geven.

Door deze twee te combineren, kunnen musea en bibliotheken in de toekomst veel sneller duizenden schilderijen beschrijven en kunnen bezoekers makkelijker door de geschiedenis "surfen", zonder dat ze eerst jaren moeten studeren. Het is alsof je een gids krijgt die niet alleen de namen van de bloemen kent, maar ook weet welke bloemen samen een prachtig boeket vormen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →