CangjieBench: Benchmarking LLMs on a Low-Resource General-Purpose Programming Language

Il paper introduce CangjieBench, un benchmark privo di contaminazione per valutare le capacità dei modelli linguistici su Cangjie, una lingua di programmazione generale a risorse limitate, rivelando che la generazione vincolata alla sintassi offre il miglior compromesso tra accuratezza e costo computazionale.

Junhang Cheng, Fang Liu, Jia Li, Chengru Wu, Nanxiang Jiang, Li Zhang

Pubblicato 2026-03-17
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Immagina che i Modelli Linguistici (LLM) come ChatGPT siano dei cucinatori stellati. Questi chef sono maestri assoluti quando cucinano piatti famosi e diffusi in tutto il mondo, come la pizza (Python) o il burger (C++). Hanno letto milioni di ricette, quindi sanno esattamente cosa fare.

Tuttavia, cosa succede se chiedi a questi chef di cucinare un piatto fatto con un ingrediente nuovissimo e rarissimo, che è stato inventato solo ieri e che nessuno ha mai usato prima?

1. Il Problema: Il "Cangjie" è un Ingrediente Sconosciuto

Il paper parla di Cangjie, un nuovo linguaggio di programmazione creato da Huawei. È come un nuovo tipo di pasta o un nuovo spezia che non esiste in nessun libro di cucina vecchio.

  • Il problema: I modelli di intelligenza artificiale sono stati addestrati su vecchi libri di cucina (dati di addestramento). Non hanno mai visto Cangjie. Se provi a chiedere loro di scrivere codice in Cangjie, è come chiedere a uno chef di fare un "risotto alla cannella" senza sapere che la cannella non va nel risotto: il risultato sarà un disastro o, peggio, non si cuocerà affatto.
  • La ricerca precedente: Fino ad ora, gli scienziati avevano testato l'intelligenza artificiale solo su lingue "di nicchia" molto specifiche (come il linguaggio per i circuiti elettronici o per le criptovalute). Ma Cangjie è diverso: è un linguaggio generale, come l'italiano o l'inglese, ma semplicemente... non c'è ancora nessuno che lo parli.

2. La Soluzione: CANGJIEBENCH (Il "Menu di Prova")

Per capire se questi chef possono imparare a cucinare con questo nuovo ingrediente senza doverli riaddestrare da zero (cosa che costerebbe una fortuna), gli autori hanno creato CANGJIEBENCH.

È come un menu di prova segreto:

  • Hanno preso dei problemi di cucina classici (già risolti in italiano, cioè Python) e li hanno tradotti manualmente in Cangjie.
  • Non hanno copiato nulla da internet (perché non esiste), quindi è una prova "pulita": se l'AI risolve il problema, lo ha davvero imparato, non l'ha solo memorizzato.
  • Il menu contiene 248 piatti: alcuni semplici (funzioni base) e altri complessi (classi intere).

3. L'Esperimento: Come imparano gli Chef?

Gli autori hanno messo alla prova diversi "chef" (modelli AI) con quattro metodi diversi per vedere chi riesce a cucinare il piatto giusto:

  1. Generazione Diretta (Il "Scommetti tutto"): Chiedi allo chef: "Fammi questo piatto in Cangjie!" senza dargli nulla.
    • Risultato: Disastro. Lo chef non sa nemmeno come si tiene il coltello in Cangjie. Il piatto non viene mai cucinato.
  2. Generazione con Regole (Il "Ricettario Rapido"): Dai allo chef un foglietto con le regole grammaticali di Cangjie (es. "qui si usa il punto e virgola", "qui le variabili si chiamano così").
    • Risultato: Ottimo! È il miglior compromesso. Lo chef capisce subito la logica (che già conosce) e si adatta alle nuove regole. È come dare a uno chef italiano le istruzioni per usare la pasta giapponese: sa già cucinare, deve solo imparare la tecnica.
  3. RAG (Il "Cerca nel Libro"): Dai allo chef un computer con cui può cercare online manuali e vecchi appunti su Cangjie mentre cucina.
    • Risultato: Funziona, ma è lento e spesso lo chef si confonde cercando di trovare la ricetta giusta nel libro.
  4. Agent (Il "Apprendista Investigatore"): Dai allo chef un assistente che può aprire il libro, leggere, scrivere, sbagliare, correggersi e chiedere aiuto finché il piatto non è perfetto.
    • Risultato: Il migliore in assoluto (il piatto viene perfetto), ma costa tantissimo in termini di tempo e risorse (come se lo chef leggesse 100 libri prima di accendere il fuoco).

4. La Sorpresa: Tradurre è più difficile che Inventare?

C'è un paradosso interessante scoperto dal paper.

  • Se chiedi all'AI: "Scrivi un codice Cangjie per fare X" (partendo da zero), spesso ci riesce meglio.
  • Se chiedi all'AI: "Prendi questo codice Python e trasformalo in Cangjie" (traduzione), sbaglia di più.

Perché? È come se lo chef, vedendo la ricetta in italiano, si ostinasse a usare gli ingredienti italiani anche se gli hai detto di usare quelli giapponesi. L'AI si "fissa" sulla struttura della lingua originale (Python) e non riesce a liberarsene per adattarsi alla nuova (Cangjie). È un caso di "interferenza negativa": sapere troppo la lingua vecchia ostacola l'apprendimento di quella nuova.

In Sintesi

Questo studio ci dice due cose fondamentali:

  1. Le regole contano: Se diamo all'AI le regole grammaticali di una nuova lingua, può impararla istantaneamente senza bisogno di anni di studio (addestramento). Non serve un nuovo cervello, serve solo un manuale di istruzioni.
  2. La traduzione è insidiosa: A volte è più facile inventare qualcosa in una nuova lingua che tradurre qualcosa da una lingua vecchia, perché il nostro cervello (o l'AI) tende a copiare i vecchi schemi invece di adattarsi.

CANGJIEBENCH è quindi la prima "palestra" sicura per testare quanto velocemente l'intelligenza artificiale può imparare lingue di programmazione nuove e rare, preparandoci per il futuro in cui potrebbero nascere decine di nuovi linguaggi ogni anno.

Ricevi articoli come questo nella tua casella di posta

Digest giornalieri o settimanali personalizzati in base ai tuoi interessi. Riassunti Gist o tecnici, nella tua lingua.

Prova Digest →