CREATE: Testing LLMs for Associative Creativity

Ce papier présente CREATE, un nouveau benchmark conçu pour évaluer la capacité des modèles de langage à effectuer un raisonnement associatif créatif en générant des connexions spécifiques et diversifiées entre des concepts, révélant ainsi les limites actuelles des modèles les plus avancés et des techniques de prompting.

Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman, Junyi Jessy Li, Greg Durrett

Publié Wed, 11 Ma
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🧠 Le Grand Jeu des Connexions : Comment tester si une IA est vraiment créative ?

Imaginez que vous êtes dans une immense bibliothèque où chaque livre, chaque personne et chaque objet est un point sur une carte. La créativité, c'est la capacité à trouver un chemin secret entre deux points qui semblent n'avoir rien à voir l'un avec l'autre.

Par exemple : Comment relier Dakota Johnson (une actrice) à un film de science-fiction ?

  • L'approche classique (l'IA "bête") : Elle dit : "Elle a joué dans un film de science-fiction." (C'est vrai, mais c'est ennuyeux et tout le monde le sait).
  • L'approche créative (l'IA "géniale") : Elle dit : "Dakota Johnson est la belle-fille d'Antonio Banderas. Antonio Banderas a joué dans Shrek. Shrek est un film de fantasy." 🐉👸

C'est exactement ce que les auteurs de ce papier, CREATE, veulent tester. Ils ont créé un nouveau jeu pour voir si les intelligences artificielles (les IA) sont capables de faire ces liens "tordus" mais intelligents, ou si elles se contentent de répéter ce qu'elles ont déjà lu.

🕵️‍♂️ Le Jeu : "Trouve le Chemin Caché"

Pour tester cela, les chercheurs ont créé un terrain de jeu appelé CREATE. Voici comment ça marche :

  1. La Question : On donne à l'IA deux entités du monde réel (ex: un musicien et un scientifique).
  2. La Mission : L'IA doit inventer plusieurs chemins pour les relier.
  3. Les Règles du Jeu :
    • La Précision (La "Qualité") : Le chemin ne doit pas être trop banal. Dire "ils sont tous deux humains" est trop facile. Dire "ils ont tous deux fréquenté la même université obscure" est mieux.
    • La Diversité (La "Variété") : L'IA ne doit pas donner 10 fois la même réponse avec des mots différents. Elle doit explorer des directions différentes (famille, travail, voyages, hobbies).

C'est comme si on demandait à un détective de trouver 5 façons différentes de relier deux suspects, et que le meilleur détective est celui qui trouve le lien le plus surprenant mais vrai.

🏆 Comment on note l'IA ?

Les chercheurs ne regardent pas juste si la réponse est "vraie". Ils utilisent une formule mathématique (un peu comme un score de golf) qui combine deux choses :

  • La force du lien : Est-ce que c'est un détail intéressant ou une évidence ?
  • La différence : Est-ce que cette réponse est différente de celles données par les autres IA ?

Si une IA donne 50 réponses toutes identiques, son score sera bas. Si elle donne 5 réponses très différentes et très intelligentes, son score sera élevé.

🤖 Ce qu'ils ont découvert (Les Résultats)

Ils ont testé les IA les plus puissantes du moment (comme GPT-5, Claude, Gemini, etc.) et voici ce qu'ils ont vu :

  1. Les IA sont bonnes, mais pas parfaites : Les modèles les plus avancés arrivent à trouver des liens créatifs, bien mieux que les modèles plus petits.
  2. Le piège de la "répétition" : Même les IA les plus intelligentes ont tendance à tomber dans les mêmes chemins. Elles trouvent souvent les mêmes liens "évidents" et ont du mal à sortir des sentiers battus pour trouver des pépites vraiment originales.
  3. Plus de réflexion ne veut pas dire plus de créativité : C'est une surprise ! Les chercheurs ont demandé aux IA de "réfléchir plus longtemps" (en leur donnant plus de temps de calcul). Résultat ? Ça ne les a pas rendues plus créatives. Elles ont juste répété les mêmes idées avec plus de détails. C'est comme si un étudiant passait 2 heures à relire son devoir sans jamais trouver une nouvelle idée.
  4. L'astuce des "prompts" (les instructions) : Demander à l'IA "Sois créative !" aide un tout petit peu, mais pas autant qu'on l'espérait.

💡 La Conclusion en une phrase

Ce papier nous dit que nos IA actuelles sont d'excellents encyclopédistes (elles savent tout), mais qu'elles sont encore des créateurs moyens (elles ont du mal à inventer des liens vraiment nouveaux et surprenants).

Le défi pour l'avenir n'est pas de faire des IA plus grosses, mais de trouver un moyen de les aider à explorer l'immense bibliothèque de la connaissance sans se perdre dans les allées les plus fréquentées. C'est un peu comme apprendre à un robot à ne pas suivre la foule, mais à trouver son propre chemin dans la forêt. 🌲🤖✨