The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models

Questo studio fornisce una spiegazione unificata della distribuzione delle frequenze dei fonemi nelle lingue mondiali, dimostrando come essa sia governata da modelli macroscopici basati sulla distribuzione di Dirichlet e da modelli microscopici di massima entropia che integrano vincoli articolatori, fonotattici e lessicali.

Fermín Moscoso del Prado Martín, Suchir Salhan

Pubblicato 2026-03-04
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Immagina che ogni lingua del mondo sia come una grande orchestra composta da diversi strumenti. In linguistica, questi "strumenti" sono i fonemi, ovvero i suoni base che usiamo per parlare (come la "a", la "b", la "s", ecc.).

Questo studio scientifico si chiede: "Perché in alcune lingue certi suoni si sentono molto spesso, mentre altri sono rari? E c'è una regola universale che governa questa musica?"

Gli autori, due ricercatori di Cambridge, hanno scoperto che la risposta sta in due livelli: uno macroscopico (guardare l'orchestra da lontano) e uno microscopico (guardare ogni singolo musicista da vicino).

Ecco la spiegazione semplice, con qualche metafora per rendere il tutto più chiaro.


1. Il Livello Macroscopico: La "Regola dell'Equilibrio"

Immagina di avere un panino gigante (la somma di tutte le probabilità di usare i suoni, che deve fare 100%).

  • Se hai un'orchestra piccola (pochi suoni, come in alcune lingue con solo 10-15 suoni), devi dividere il panino in fette grandi. I suoni saranno usati in modo molto uniforme.
  • Se hai un'orchestra enorme (molte lingue con 60, 80 o addirittura 100 suoni diversi), devi tagliare il panino in fette piccolissime.

La scoperta:
Gli autori hanno scoperto che non importa quanto sia grande l'orchestra, c'è una legge matematica precisa (chiamata Distribuzione di Dirichlet) che dice come i suoni si distribuiscono.

  • L'analogia della "Sicurezza": Più suoni ha una lingua, più i suoi suoni tendono a essere usati in modo "noioso" e uniforme. È come se, per non fare confusione con troppi strumenti diversi, la lingua li usasse tutti con la stessa frequenza media.
  • Il paradosso: Se una lingua ha tanti suoni diversi (è complessa), la distribuzione di questi suoni diventa meno sorprendente (meno "entropia"). È come se il cervello umano dicesse: "Ok, hai molti colori nel tuo palette, ma non usarli tutti in modo casuale, altrimenti diventa caotico. Usali tutti con la stessa frequenza media per mantenere l'ordine".

Questo conferma una vecchia teoria chiamata Ipotesi della Compensazione: se una lingua è complessa in un punto (molti suoni diversi), compensa rendendo l'uso di quei suoni più prevedibile e uniforme.


2. Il Livello Microscopico: Il "Motore" dietro ogni Suono

Ma perché il suono "T" è più frequente del suono "Q" in italiano? O perché in inglese la "S" è onnipresente?
Qui gli autori usano un principio chiamato Massima Entropia. Immagina di essere un detective che cerca di indovinare la probabilità che un suono appaia, basandosi su tre "indizi" fondamentali:

A. Il Costo Energetico (La Pigrizia del Corpo)

  • Metafora: Immagina di dover correre una maratona. Alcuni suoni sono come correre in piano (facili da fare, come la "A"), altri sono come correre in salita con uno zaino pesante (difficili, come certi suoni gutturali complessi).
  • La regola: I suoni che richiedono più "energia" o sforzo fisico per essere prodotti sono più rari. Il nostro corpo è pigro: preferisce i suoni facili.

B. La Prevedibilità (La Sorpresa)

  • Metafora: Immagina di leggere una frase. Se vedi "C...", è molto probabile che la prossima lettera sia "A" o "O". Se invece vedi "X...", è una sorpresa.
  • La regola: Paradossalmente, gli autori scoprono che i suoni che appaiono in contesti imprevedibili (che portano più "informazione" o sorpresa) tendono ad essere più frequenti. È come se la lingua volesse assicurarsi che i suoni "sorprendenti" siano usati spesso per distinguere bene le parole. Se un suono è troppo prevedibile, rischia di essere "cancellato" nel tempo perché inutile.

C. L'Utilità per le Parole (Il Significato)

  • Metafora: I suoni servono a costruire parole. Alcuni suoni sono come chiavi master: se li usi, ti aiutano a capire subito di quale parola si tratta.
  • La regola: I suoni che aiutano di più a distinguere una parola dall'altra (ad esempio, la differenza tra "pala" e "bala" sta nella "p" e nella "b") vengono usati più spesso. La lingua premia i suoni che sono più utili per comunicare significati diversi.

3. Il Risultato Finale: Una Ricetta Perfetta

Gli autori hanno preso questi tre indizi (Sforzo fisico, Prevedibilità, Utilità per il significato) e li hanno messi in una "calcolatrice matematica" (il modello di Massima Entropia).

Il risultato è sbalorditivo:
Quando hanno usato questa calcolatrice per prevedere quanto spesso appare ogni suono in diverse lingue, la loro previsione è stata quasi perfetta. Hanno indovinato la frequenza dei suoni senza guardare i dati reali, basandosi solo sulla logica di come funziona il cervello umano e la fisica della bocca.

In sintesi

Questa ricerca ci dice che la diversità delle lingue non è caos. È come se tutte le lingue del mondo stessero seguendo una ricetta universale:

  1. Da lontano: Se hai molti suoni, li usi tutti in modo uniforme per non impazzire (Compensazione).
  2. Da vicino: Ogni singolo suono appare con una frequenza precisa perché bilancia quanto è faticoso farlo, quanto è utile per capire le parole e quanto è sorprendente nel contesto.

È una prova che, sotto la superficie delle differenze culturali, la nostra mente e la nostra bocca lavorano secondo leggi matematiche ed economiche precise per rendere la comunicazione efficiente.