Each language version is independently generated for its own context, not a direct translation.
¡Hola! Imagina que tienes una biblioteca antigua llena de libros de hace 400 años. Estos libros no son de cuentos de hadas, sino manuales técnicos sobre cómo construir barcos gigantes en la época de los grandes exploradores. El problema es que están escritos en idiomas antiguos, con dibujos complejos y términos que solo un experto en barcos de madera podría entender.
Los autores de este artículo, Carlos y Benjamin, se preguntaron: "¿Podemos usar la inteligencia artificial moderna para 'leer' y organizar estos libros antiguos, tal como lo hace Google con las fotos de nuestras vacaciones?"
Aquí te explico su trabajo con una analogía sencilla:
1. El Problema: El "Traductor" que no entiende el jerga
La inteligencia artificial (IA) actual es como un estudiante muy brillante que ha visto billones de fotos de gatos, coches y personas. Si le muestras una foto de un perro, lo identifica al instante.
Pero, si le muestras un dibujo de un barco de 1600 y le preguntas: "¿Qué es esa pieza de madera que parece un gancho?", la IA se confunde.
- Por qué: No ha visto suficientes fotos de barcos antiguos (le falta "entrenamiento").
- El riesgo: Podría llamarle "gancho" cuando en realidad es una pieza técnica llamada "Codaste". Es como si un traductor intentara traducir un poema antiguo usando solo palabras de un diccionario moderno; el sentido se pierde.
2. La Solución: Un Equipo de Tres Expertos (La "Trinidad" de la IA)
Para solucionar esto, los autores crearon un equipo de trabajo digital. Imagina que son tres personas trabajando juntas para limpiar y etiquetar una habitación llena de muebles antiguos:
El Cortador (SAM2): El "Cuchillo de Chef"
Primero, necesitan separar las partes del dibujo. El algoritmo SAM2 actúa como un cuchillo de chef muy preciso. Mira el dibujo del barco y dice: "Aquí hay una pieza, aquí hay otra, y aquí hay una mancha de tinta". Recorta digitalmente cada parte para que no estén todas mezcladas.- Analogía: Es como si tomaras un puzzle gigante y separaras todas las piezas individuales antes de intentar adivinar qué imagen forman.
El Etiqueta (ChatGPT / Florence2): El "Estudiante Curioso"
Una vez que tienen las piezas separadas, necesitan ponerles nombres. Aquí entra la IA generativa (como ChatGPT). Le muestra la pieza y le pregunta: "¿Qué es esto?".- El truco: Si le preguntas simplemente "¿Qué es esto?", la IA podría decir "una rueda" (porque ve una rueda). Pero los autores le dan un "chuleta" (un glosario especializado). Le dicen: "Esto es un barco de madera del siglo XVII, ¿qué es esta pieza?". Así, la IA deja de adivinar y empieza a usar el vocabulario correcto.
El Arquitecto (Ontología): El "Mapa del Tesoro"
Para que el "Estudiante Curioso" no se equivoque, los autores le dieron un mapa de reglas llamado ontoShip. Es como un árbol genealógico de los barcos.- Analogía: Si la IA ve una pieza y el mapa le dice: "Oye, esta pieza siempre va pegada al fondo del barco y se llama 'Quilha'", la IA ya no tiene dudas. El mapa le dice dónde debe ir cada cosa y cómo se relacionan entre sí.
3. El Resultado: De "Bosque" a "Biblioteca Organizada"
Antes de este trabajo, buscar una foto de un "timón" en estos libros antiguos era como buscar una aguja en un pajar. Tenías que hojear miles de páginas manualmente.
Con su nuevo sistema:
- La IA recorta el dibujo del barco.
- La IA identifica la pieza usando el mapa de reglas.
- La IA pone una etiqueta digital sobre la pieza.
Ahora, un historiador o incluso un niño curioso puede buscar "vela" en una base de datos y encontrar instantáneamente todos los dibujos de velas de esos libros antiguos, aunque el libro original esté en italiano o en latín.
¿Por qué es importante?
Imagina que estos libros son joyas de la historia. Si no se pueden buscar ni entender, están "dormidos" en una caja. Este proyecto es como ponerles una alarma y una luz para que el mundo pueda verlos, estudiarlos y aprender de la ingeniería de nuestros antepasados.
En resumen: Los autores tomaron herramientas de IA que son geniales para fotos modernas (como las de Instagram) y las "entrenaron" con un diccionario especial de barcos antiguos para que puedan entender y organizar el arte histórico, haciendo que la historia sea accesible para todos.