CREATE: Testing LLMs for Associative Creativity

Il paper introduce CREATE, un benchmark progettato per valutare la capacità dei modelli linguistici di generare connessioni associative creative, specifiche e diversificate tra concetti, evidenziando come i modelli più avanzati ottengano risultati superiori ma come il compito rimanga complesso e difficile da saturare.

Manya Wadhwa, Tiasa Singha Roy, Harvey Lederman, Junyi Jessy Li, Greg Durrett

Pubblicato Wed, 11 Ma
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

🧠 CREATE: Il Test di "Pensiero Laterale" per le Intelligenze Artificiali

Immagina di avere un assistente super intelligente, capace di ricordare ogni libro mai scritto. Ma c'è un problema: questo assistente è bravissimo a ripetere ciò che sa, ma fa fatica a collegare i puntini in modi nuovi e sorprendenti.

Gli autori di questo paper (un team di ricercatori delle università di New York e Austin) si sono chiesti: "Le nostre Intelligenze Artificiali (LLM) sono davvero creative, o sono solo dei bravi ripetitori?"

Per scoprirlo, hanno creato CREATE, un nuovo "campo di gioco" per testare la creatività associativa delle AI.

🕵️‍♀️ Il Gioco: "Collega i Punti"

Immagina di essere in una stanza piena di oggetti: una Dakota Johnson (l'attrice), un film di fantascienza e un attore di commedia.
Un compito noioso per un computer sarebbe: "Chi ha recitato in un film con Dakota Johnson?" (Risposta: Chris Evans).
Un compito creativo è: "Trova tutti i modi possibili, anche quelli più strani, per collegare Dakota Johnson a un attore famoso dei film di fantascienza."

Ecco come funziona CREATE:

  1. L'Obiettivo: L'AI deve trovare percorsi (catene di collegamenti) tra due persone o cose.
  2. La Regola d'Oro: Non deve trovare solo il collegamento ovvio (es. "hanno lavorato insieme"). Deve trovare collegamenti forti (precisi, come "è la figliastra di") e diversi (non deve ripetere la stessa idea 10 volte).
    • Esempio: Dakota Johnson è la figliastra di Antonio Banderas. Antonio Banderas ha recitato in Shrek. Shrek è un film di fantasia. Ecco un collegamento creativo!

📏 Come si misura la "Creatività"?

Gli autori non usano un voto scolastico, ma due metri magici:

  1. La Specificità (La "Forza" del legame):
    Immagina che i legami siano come elastici.

    • Un elastico debole è dire: "Dakota Johnson e Chris Evans sono entrambi americani". (Vero, ma noioso, perché lo sono milioni di persone).
    • Un elastico forte è dire: "Dakota Johnson è la figliastra di Antonio Banderas". (Molto specifico, unico, interessante).
      L'AI viene premiata se usa elastici forti.
  2. La Diversità (La "Varietà"):
    Se l'AI ti dà 10 collegamenti che sono tutti "hanno lavorato insieme in film diversi", non è creativa. È come se un cuoco ti servisse 10 piatti che sono tutti "pasta al pomodoro", solo con forme diverse.
    L'AI deve darti un mix: un legame familiare, uno lavorativo, uno geografico, uno storico.

🏆 Cosa hanno scoperto? (I Risultati)

Hanno messo alla prova i modelli più potenti del momento (come GPT-5, Claude, Gemini). Ecco le sorprese:

  • I "Giganti" vincono, ma non sempre: I modelli più grandi e costosi fanno meglio, trovando collegamenti più intelligenti. Ma non sono perfetti.
  • Più tempo non significa più creatività: Hanno dato ai modelli "pensanti" (quelli che ragionano prima di rispondere) più tempo e più "token" (parole da pensare). Risultato? Spesso non hanno trovato collegamenti migliori. È come dare a un artista più tempo per dipingere: a volte, più tempo non significa un quadro più bello, significa solo che l'artista si perde nei dettagli.
  • Il paradosso della verità: C'è un compromesso. I modelli che cercano di essere molto creativi a volte inventano cose (allucinano). I modelli che sono molto precisi (non inventano nulla) tendono a essere più noiosi e meno creativi. Trovare l'equilibrio è difficile.

💡 Perché è importante?

Pensa alla creatività come a un muscolo. Finora, abbiamo allenato le AI a essere forti nella memoria e nel calcolo (i muscoli della forza). Con CREATE, stiamo iniziando ad allenare il muscolo della connessione.

Questo test è fondamentale perché:

  • Ci aiuta a capire se le AI potranno un giorno aiutarci a inventare nuove scoperte scientifiche (collegando malattie a farmaci in modi che nessun umano ha visto).
  • Ci dice che non basta "pensare di più" (più tempo di calcolo) per essere creativi; serve un nuovo modo di cercare le idee.

🎨 In sintesi

CREATE è come un gioco di "Indovina il collegamento" per computer. Non chiede all'AI di essere un enciclopedia, ma di essere un detective creativo. Se l'AI riesce a trovare il collegamento tra un attore di Hollywood e un gene umano in modo sorprendente e vero, allora sta davvero "pensando" in modo creativo.

Al momento, le AI sono dei buoni giocatori, ma non sono ancora dei geni della creatività. C'è ancora molta strada da fare prima che possano davvero sostituire (o affiancare) l'ingegno umano nelle scoperte più folli e geniali.