Iconographic Classification and Content-Based Recommendation for Digitized Artworks

Este artículo presenta un sistema prototipo que automatiza la clasificación iconográfica y la recomendación basada en contenido de obras de arte digitalizadas mediante la integración de la detección de objetos YOLOv8, el vocabulario Iconclass y algoritmos de inferencia, demostrando su potencial para acelerar la catalogación y mejorar la navegación en grandes repositorios de patrimonio cultural.

Krzysztof Kutt, Maciej Baczyński

Publicado 2026-02-24
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes una biblioteca gigante llena de millones de cuadros antiguos, pero nadie ha escrito las etiquetas que dicen de qué tratan realmente. Solo tienes la fecha y el nombre del pintor. Si quieres encontrar un cuadro sobre "la justicia" o "una caza de halcones", tendrías que pasar horas mirando cada imagen con lupa, algo que es imposible de hacer manualmente.

Los autores de este artículo, Krzysztof y Maciej, han creado un asistente digital inteligente (llamado CARIS) para ayudar a los expertos a organizar y encontrar estas obras de arte. Aquí te explico cómo funciona, usando analogías sencillas:

1. El Problema: El "Lenguaje" de los Cuadros

Los museos usan un diccionario muy especial y complejo llamado Iconclass. Es como un código de barras para el significado de un cuadro.

  • Si ves un perro, el código no es solo "perro", sino algo como "34B11: Perro".
  • Si ves a un perro mordiendo una concha, el código cambia a algo muy específico sobre un mito de Hércules.
    El problema es que este diccionario es enorme y difícil de usar. Los humanos tardan mucho en asignar estos códigos.

2. La Solución: El Asistente en Cuatro Pasos

El sistema CARIS funciona como un detective con cuatro herramientas principales:

Paso 1: Los Ojos de Águila (YOLO)

Primero, el sistema usa una cámara digital muy rápida (llamada YOLO) que mira el cuadro y dice: "¡Veo un caballo! ¡Veo un humano! ¡Veo un perro!".

  • Analogía: Es como un niño que señala todo lo que ve en una foto y lo nombra, pero sin entender la historia detrás de la foto.

Paso 2: El Traductor (Mapeo)

Luego, el sistema toma esas palabras ("caballo", "perro") y las traduce al diccionario Iconclass.

  • El truco: A veces, ver un "perro" puede significar muchas cosas diferentes en el arte (un perro de circo, un perro de caza, un perro bíblico). El sistema intenta adivinar cuál es el código correcto basándose en qué otros objetos hay en la foto.
  • Analogía: Es como si el sistema dijera: "Veo un perro y un hombre con una lanza, así que probablemente no es un perro de circo, sino un perro de caza".

Paso 3: El Intelecto (Inferencia)

Aquí es donde el sistema se vuelve más listo. A veces, el significado no es un objeto, sino una idea abstracta.

  • Si el sistema ve una mujer con una venda en los ojos, una balanza y una espada, no solo ve "mujer" y "espada". El sistema infiere que esto significa "Justicia".
  • Analogía: Es como ver a alguien con un sombrero de chef y un delantal, y deducir que es un "cocinero", aunque no hayas visto la cocina.

Paso 4: El Recomendador (El Amigo que Sabe de Arte)

Finalmente, si te gusta un cuadro, el sistema te recomienda otros que son temáticamente similares. Pero no busca cuadros que se vean iguales (como dos paisajes verdes), busca cuadros que signifiquen lo mismo.
Usa tres estrategias diferentes para encontrar estos "primos" del arte:

  1. El Familiar: Busca cuadros que compartan códigos muy parecidos en el árbol genealógico de Iconclass (como buscar a un primo hermano en lugar de un primo lejano).
  2. El Experto en Rarezas (IDF): Si un cuadro tiene un código muy raro y específico (ej. "Hércules mordiendo una concha"), le da mucho peso. Prefiere encontrar algo con ese detalle único que algo genérico.
  3. El Calculista (Jaccard): Mira qué porcentaje de códigos se repiten entre dos cuadros para ver qué tan "pegados" están temáticamente.

3. ¿Qué descubrieron? (Los Resultados)

  • Lo bueno: El sistema funciona muy bien para encontrar objetos y sugerir códigos. Puede acelerar muchísimo el trabajo de los curadores de museos.
  • Lo difícil: A veces, la cámara (YOLO) se equivoca. Si confunde un perro con un oso, el sistema sugerirá códigos de "osos" en lugar de "perros", y la recomendación saldrá mal.
  • La conclusión: La clave no es que la inteligencia artificial "piense" como un humano, sino que use la estructura lógica (el diccionario Iconclass) para darle sentido a lo que ve la cámara.

En Resumen

Imagina que CARIS es un bibliotecario robot que tiene una cámara en los ojos y un diccionario de símbolos en la cabeza.

  1. Mira el cuadro y dice: "Veo un caballo".
  2. Consulta su diccionario y dice: "Esto significa 'cavallería'".
  3. Te dice: "Si te gusta este, probablemente te gustará este otro cuadro que también trata sobre 'cavallería', aunque sea de un color diferente".

El objetivo no es reemplazar a los expertos humanos, sino hacerles el trabajo pesado para que puedan dedicar más tiempo a contar las historias fascinantes detrás de las obras de arte.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →