Differential syntactic and semantic encoding in LLMs

Questo articolo dimostra che le informazioni sintattiche e semantiche nel LLM DeepSeek-V3 sono parzialmente codificate in modo lineare e distribuite in modo differenziale tra i livelli, come dimostrato dalla possibilità di disaccoppiare tali segnali sottraendo i centroidi medi delle rappresentazioni.

Autori originali: Santiago Acevedo, Alessandro Laio, Marco Baroni

Pubblicato 2026-05-28
📖 4 min di lettura☕ Lettura da pausa caffè

Autori originali: Santiago Acevedo, Alessandro Laio, Marco Baroni

Articolo originale sotto licenza CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Questa è una spiegazione generata dall'IA dell'articolo qui sotto. Non è stata scritta né approvata dagli autori. Per precisione tecnica, consulta l'articolo originale. Leggi il disclaimer completo

Immagina un Modello Linguistico di grandi dimensioni (LLM) come DeepSeek-V3 come una gigantesca biblioteca a più piani. All'interno di questa biblioteca, ogni frase che digiti viene trasformata in un'impronta digitale unica e ad alta dimensionalità (un vettore) mentre attraversa i diversi piani (strati) dell'edificio.

La grande domanda che questo articolo si pone è: Come organizza la biblioteca queste impronte digitali? Nello specifico, mantiene la "struttura" della frase (sintassi) separata dal "significato" della frase (semantica), o sono tutte mescolate insieme in un grande frullato?

Ecco cosa hanno scoperto i ricercatori, spiegato in modo semplice:

1. Il trucco della "Media" (Trovare il nucleo)

I ricercatori hanno realizzato che se hai un gruppo di frasi che appaiono grammaticalmente identiche (ad esempio, "Il gatto si è seduto", "Il cane ha corso", "L'uccello ha volato"), condividono uno "scheletro" comune.

  • L'analogia: Immagina di scattare una foto a 100 persone diverse che indossano esattamente lo stesso tipo di cappello. Se medi tutte quelle foto insieme, i volti si sfocano, ma il cappello diventa super nitido e chiaro.
  • Il metodo: Lo hanno fatto matematicamente. Hanno preso frasi con la stessa struttura grammaticale e hanno mediato le loro impronte digitali per creare un "Centroide Sintattico" (il cappello della pura grammatica). Hanno fatto lo stesso per frasi con lo stesso significato ma parole diverse per creare un "Centroide Semantico" (il cappello del puro significato).

2. Il test della "Sottrazione" (Rimuovere il cappello)

Una volta ottenuti questi vettori "puri" di grammatica e significato, hanno provato a rimuoverli dalle impronte digitali delle frasi originali.

  • L'analogia: Immagina di avere una foto di una persona che indossa un cappello. Se sottrai digitalmente il vettore "cappello" dalla foto, il cappello scompare. Se la foto assomiglia ancora alla persona, sai che il cappello era un livello separato. Se anche il viso della persona scompare, cappello e viso erano mescolati insieme.
  • Il risultato: Quando hanno sottratto il "Cappello Grammaticale" da una frase, la frase ha perso la capacità di abbinarsi ad altre frasi che avevano la stessa grammatica. Quando hanno sottratto il "Cappello del Significato", ha perso la capacità di abbinarsi a frasi che significavano la stessa cosa.
  • La conclusione: Questo dimostra che il modello codifica grammatica e significato in modo lineare. Sono come ingredienti distinti in una ricetta che possono essere separati matematicamente, piuttosto che una reazione chimica in cui diventano una nuova sostanza.

3. La scoperta della "Planimetria" (Dove risiedono le cose)

La biblioteca ha molti piani. I ricercatori hanno scoperto che grammatica e significato vivono su piani diversi.

  • Grammatica (Sintassi): È come le fondamenta e i piani inferiori. È presente fin dall'inizio e rimane coerente fino alla cima. Il modello conosce la struttura di una frase quasi immediatamente.
  • Significato (Semantica): È come i piani intermedi. Quando una frase entra nella biblioteca, il modello guarda prima le parole e la struttura (piani bassi). Poi, mentre la frase si sposta verso il centro, il modello capisce cosa significa effettivamente. Quando raggiunge l'ultimo piano (dove il modello scrive la sua risposta), il significato è ancora lì, ma il focus si sposta sulla generazione dell'output.
  • L'analogia: Pensa a leggere un libro. Prima, riconosci le lettere e le parole (grammatica). Poi, a metà del paragrafo, capisci la storia (significato). Non hai bisogno di riconoscere di nuovo le lettere per capire la storia, ma hai bisogno delle lettere per iniziare.

4. La strada a senso unico (Asimmetria)

Ecco la parte più interessante: la separazione non è perfettamente uguale.

  • La grammatica è indipendente: Se rimuovi il "Significato" da una frase, la "Grammatica" rimane perfettamente intatta. Lo scheletro rimane in piedi anche se togli la carne.
  • Il significato è dipendente: Se rimuovi la "Grammatica" da una frase, il "Significato" diventa un po' traballante. Non scompare completamente, ma diventa più difficile da riconoscere.
  • L'analogia: Immagina una casa. Se rimuovi i mobili (significato), la struttura della casa (grammatica) è chiaramente ancora una casa. Ma se rimuovi muri e tetto (grammatica), i mobili (significato) sono solo un mucchio di cose a terra; è difficile capire cosa dovevano essere.

Riepilogo

L'articolo mostra che in questi giganteschi modelli di IA:

  1. Grammatica e Significato sono distinti: Sono codificati separatamente, non mescolati in modo irrimediabile.
  2. Sono lineari: Puoi "sottrarre" matematicamente l'uno dall'altro.
  3. Vivono in posti diversi: La grammatica è ovunque (specialmente all'inizio), mentre il significato raggiunge il picco nel mezzo dell'elaborazione del modello.
  4. La grammatica è la fondazione robusta: Puoi togliere il significato senza rompere la grammatica, ma togliere la grammatica rende più difficile mantenere il significato.

Ciò suggerisce che, anche se questi modelli sono addestrati semplicemente prevedendo la parola successiva, sviluppano naturalmente una struttura che assomiglia molto a come i linguisti umani pensano che funzioni il linguaggio: un quadro strutturale che sostiene un livello di significato.

Sommerso dagli articoli nel tuo campo?

Ricevi digest giornalieri degli articoli più recenti corrispondenti alle tue parole chiave di ricerca — con riassunti tecnici, nella tua lingua.

Prova Digest →