Iconographic Classification and Content-Based Recommendation for Digitized Artworks

Ce papier présente un système de preuve de concept qui automatise la classification iconographique et la recommandation d'œuvres d'art numérisées en combinant la détection d'objets par intelligence artificielle (YOLOv8) avec le vocabulaire symbolique d'Iconclass pour accélérer le catalogage et améliorer la navigation dans les grands dépôts patrimoniaux.

Krzysztof Kutt, Maciej Baczyński

Publié 2026-02-24
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

🎨 Le Projet CARIS : Un Détective et un Bibliothécaire pour l'Art

Imaginez que vous entrez dans une immense bibliothèque d'art numérique contenant des millions de tableaux. Le problème ? La plupart des livres (tableaux) n'ont pas de titre clair sur la couverture, et les bibliothécaires (les experts humains) sont trop peu nombreux pour tout lire et tout classer.

Les chercheurs Krzysztof Kutt et Maciej Baczyński ont créé un prototype appelé CARIS. C'est comme un assistant robotique qui a deux super-pouvoirs :

  1. Il regarde un tableau et devine ce qu'il représente (classification).
  2. Il vous propose d'autres tableaux qui racontent une histoire similaire (recommandation).

Voici comment cela fonctionne, étape par étape, avec des analogies simples.


1. Le Langage Secret : Iconclass 🗝️

Pour que l'ordinateur comprenne l'art, il ne peut pas utiliser des mots au hasard comme "chien" ou "triste". Il a besoin d'un langage secret et très précis appelé Iconclass.

  • L'analogie : Imaginez un code-barres géant ou un système de classement de bibliothèque ultra-détaillé.
    • Le code 34B11 ne veut pas dire juste "chien".
    • Le code 94L53 raconte une histoire précise : "Hercule découvre la teinture de Tiryns : la truffe de son chien est tachée de pourpre après avoir mordu un mollusque".
  • Le but : Passer d'une simple image à une histoire structurée.

2. L'Œil du Robot : YOLO (Le Détective) 👁️

La première étape du robot est d'ouvrir les yeux. Il utilise une technologie appelée YOLO (You Only Look Once), qui est comme un détective très rapide capable de repérer des objets dans une photo.

  • Ce qu'il fait : Il scanne le tableau et crie : "Je vois un cheval ! Je vois un humain ! Je vois un chien !"
  • Le problème : Parfois, le détective se trompe. Il peut confondre un chien avec un ours, ou ne pas voir un faucon perché sur une main.
  • La solution du papier : Le système ne se contente pas de ce que voit le détective. Il essaie de deviner le reste. Si le détective voit un chien, un cheval et un humain, le système déduit : "Ah, c'est probablement une scène de chasse !" même si le détective n'a pas vu le chasseur.

3. Le Traducteur : Du Visuel au Code 🔄

Une fois que le robot a identifié les objets, il doit les traduire en codes Iconclass. C'est là que ça devient astucieux.

  • L'analogie du Puzzle :
    • Si le robot voit un "chien", il cherche dans son dictionnaire tous les codes qui contiennent le mot "chien".
    • Mais attention ! Il y a des milliers de codes avec le mot "chien" (un chien dans la Bible, un chien de cirque, un chien de chasse...).
    • Le système utilise des règles logiques (comme un filtre) pour éliminer les mauvaises réponses. S'il ne voit que le chien tout seul, il choisit le code "Chien". S'il voit le chien + un humain + un cheval, il choisit le code "Chasse".

4. Le Conseiller de Lecture : La Recommandation 📚

Une fois le tableau "traduit" en codes, le système doit vous proposer d'autres tableaux que vous aimerez. Il utilise trois méthodes différentes, comme trois types de conseillers littéraires :

  1. Le Cousin (Similarité Hiérarchique) :

    • L'idée : Si vous aimez les tableaux sur "Hercule", ce conseiller vous montrera des tableaux sur "Hercule" ou sur ses "attributs" (comme sa massue).
    • L'analogie : C'est comme dire : "Vous avez aimé ce livre de la série Harry Potter ? Voici un autre livre du même univers, même si ce n'est pas le même chapitre."
  2. Le Collectionneur de Pépites (Poids IDF) :

    • L'idée : Ce conseiller cherche les codes rares. Si un tableau contient un code très spécifique (comme "Hercule mordant un mollusque"), c'est une "pépite".
    • L'analogie : Si vous cherchez un livre sur un sujet très pointu, ce conseiller ignore les best-sellers génériques pour vous trouver le livre unique et précis que vous cherchez.
  3. Le Miroir (Similarité Jaccard) :

    • L'idée : Il compare la liste des codes de votre tableau avec celle des autres tableaux pour voir combien ils se ressemblent exactement.
    • L'analogie : C'est comme comparer deux listes de courses. Plus elles ont d'articles en commun, plus les tableaux sont similaires.

🏆 Ce que les chercheurs ont appris (Les Résultats)

  • Le succès : Le système fonctionne ! Il peut classer des tableaux et trouver des liens cachés entre eux, même sans avoir lu l'histoire derrière.
  • La limite principale : Tout dépend de la qualité de l'œil du détective (YOLO). Si le détective ne voit pas le faucon dans la scène de chasse, le système ne pourra pas vous proposer d'autres scènes de chasse avec des faucons.
  • Le futur : Les chercheurs veulent améliorer l'œil du robot pour qu'il soit aussi bon qu'un expert humain, et ajouter une interface pour que n'importe qui puisse utiliser cet outil pour explorer le patrimoine culturel.

En résumé

Ce papier décrit un pont intelligent entre l'œil de l'ordinateur (qui voit des formes) et l'esprit de l'historien (qui comprend les symboles). Au lieu de simplement dire "c'est un chien", le système dit "c'est une scène de chasse mythologique", et vous aide à découvrir tout l'univers de l'art qui tourne autour de cette idée. C'est une étape de plus pour rendre les trésors de l'histoire accessibles à tout le monde, pas seulement aux experts.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →