Beyond Semantic Similarity: Open Challenges for Embedding-Based Creative Process Analysis Across AI Design Tools

El artículo identifica las limitaciones de las métricas de similitud semántica fijas para analizar procesos creativos en herramientas de diseño con IA y propone abordar tres desafíos clave —la alineación de la similitud con el significado creativo, el manejo de trazas multimodales y la evaluación de sistemas agénticos— mediante intervenciones contextuales asistidas por modelos de lenguaje.

Seung Won Lee, Semin Jin, Kyung Hoon Hyun

Publicado Tue, 10 Ma
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un grupo de amigos diseñando cosas: uno hace muebles, otro pinta cuadros y otro crea videojuegos. Todos usan herramientas de Inteligencia Artificial (IA) para ayudarles a crear.

El problema es que, hasta ahora, para saber quién es más creativo, los expertos miraban solo el resultado final (¿es bonita la silla? ¿es divertido el juego?). Esto es como juzgar una carrera solo por quién llega primero, sin mirar cómo corrieron, si tropezaron o si cambiaron de ruta.

Este artículo propone una nueva forma de mirar: en lugar de juzgar el producto, queremos analizar el proceso de pensamiento de los diseñadores usando las herramientas de IA. Pero, advierten, la forma actual de hacerlo tiene un gran defecto.

Aquí te explico los puntos clave con analogías sencillas:

1. El problema del "Traductor Tonto" (Similitud Semántica)

Actualmente, las herramientas de IA usan un "traductor" (llamado embedding) que convierte las palabras en números para ver qué tan parecidas son.

  • La analogía: Imagina que tienes un traductor que solo mira las palabras literales. Si un diseñador dice: "Necesito una silla apilable para guardarla" y luego dice: "Necesito una pared apilable para cambiar la habitación", el traductor dice: "¡Están muy parecidas! ¡Ambas dicen 'apilable'!".
  • La realidad creativa: Para el diseñador, el segundo comentario fue un cambio radical (un "giro creativo"). Pasó de pensar en muebles a pensar en arquitectura. Pero el traductor tonto cree que el diseñador solo está dando más detalles sobre la misma idea.
  • El resultado: La IA cree que el diseñador está avanzando poco a poco en una sola línea, cuando en realidad saltó a un nuevo universo de ideas. Esto hace que parezca que hay menos creatividad de la que realmente hay.

2. El desafío de los "Hijos de dos mundos" (Multimodalidad)

Los diseñadores no solo escriben; dibujan, hacen bocetos y tocan pantallas.

  • La analogía: Imagina que intentas entender una historia solo leyendo los subtítulos, pero ignoras las imágenes de la película.
  • El problema: A veces, un dibujo muy "feo" y un dibujo "perfecto" representan la misma idea evolucionando. Pero para una IA, se ven totalmente diferentes. O al revés: dos dibujos que se ven idénticos pueden ser estrategias de diseño opuestas.
  • La dificultad: No sabemos cómo cortar la película en "escenas" (pasos de diseño) cuando hay dibujos, palabras y clics mezclados. ¿Cuándo termina un paso y empieza el siguiente? Si no lo sabemos, el análisis se vuelve confuso.

3. El "Jugador que se juzga a sí mismo" (Sistemas Agentes)

Hoy en día, la IA no solo ayuda, sino que a veces toma decisiones por sí misma (agentes autónomos).

  • La analogía: Imagina un jugador de fútbol que tiene un entrenador en su oreja. Pero, ¿qué pasa si el entrenador es el mismo jugador? Si el jugador decide correr rápido solo porque el entrenador le dijo "corre rápido", ¿estamos viendo una jugada genial o solo obedeciendo una orden?
  • El problema: Si la IA usa esas mismas herramientas de "traductor tonto" para decidir qué hacer a continuación, puede crear un bucle. La IA podría generar muchas ideas diferentes simplemente porque su configuración le pide "variedad", no porque el diseñador esté siendo realmente creativo. Es difícil saber si la creatividad viene del humano o si es solo un "ruido" generado por la máquina.

¿Qué proponen los autores?

Dicen que necesitamos un "Traductor con Sentido Común".
En lugar de usar un traductor automático que solo cuenta palabras, proponen usar modelos de IA más inteligentes (como los que usan en los chats modernos) que entiendan el contexto.

  • Que sepan que cuando alguien cambia de "silla" a "pared", aunque diga la misma palabra, está cambiando de tema.
  • Que puedan entender que un dibujo borroso y uno limpio son parte de la misma historia.
  • Que sepan distinguir si la IA está siendo creativa o si solo está siguiendo sus propias instrucciones.

En resumen:
El artículo dice: "Tenemos una lupa muy potente para ver cómo diseñan las personas con IA, pero esa lupa está un poco empañada. A veces confunde 'cambiar de idea' con 'seguir igual'. Si queremos comparar la creatividad entre diferentes herramientas (diseño de muebles vs. diseño de videojuegos), primero tenemos que arreglar esa lupa para que vea la verdadera magia de los cambios de ideas, no solo las palabras repetidas".