Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

Il documento presenta Covenant-72B, un modello linguistico su larga scala addestrato in modo collaborativo e globale tramite partecipanti permissionless supportati da un protocollo blockchain, dimostrando che è possibile raggiungere prestazioni competitive con i modelli centralizzati pur consentendo una partecipazione aperta e decentralizzata.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare

Pubblicato Tue, 10 Ma
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Ecco una spiegazione del paper Covenant-72B pensata per chiunque, usando metafore semplici e un linguaggio quotidiano.

🌍 L'idea: Costruire un "Super-Cervello" con l'aiuto di tutti

Immagina di voler costruire un'enorme biblioteca di conoscenza (un modello di intelligenza artificiale) che richiede così tanti libri e così tanto lavoro che nessuna singola azienda al mondo può permetterselo da sola. Di solito, solo i giganti tecnologici con data center costosissimi riescono a farlo.

Covenant-72B è un esperimento rivoluzionario: invece di affidarsi a un unico gigante, hanno chiesto aiuto a tutti. Hanno creato un progetto dove chiunque, da casa propria, con il proprio computer potente, può unirsi e dare una mano. È come se invece di costruire un grattacielo con una sola squadra di muratori, avessero invitato milioni di persone a portare un mattone ciascuno.

🚀 Come hanno fatto? Tre segreti magici

Per far funzionare questa "festa globale" senza che il caos prenda il sopravvento, hanno usato tre trucchi fondamentali:

1. Il "Messaggero Veloce" (SparseLoCo)

Immagina che ogni partecipante stia studiando un libro. Alla fine della giornata, invece di inviare all'organizzatore un riassunto di 1000 pagine (che richiederebbe giorni per essere inviato su internet), ogni partecipante invia solo 10 parole chiave che riassumono l'idea principale.

  • La metafora: È come se invece di spedire un'intera enciclopedia via posta, ognuno mandasse un singolo SMS con la frase più importante.
  • Il risultato: Hanno compresso i dati di oltre 146 volte. Questo significa che anche con una connessione internet normale (non una fibra ottica aziendale), il lavoro è stato velocissimo.

2. Il "Giudice Imparziale" (Gauntlet e Blockchain)

C'era un problema: se chiunque può partecipare, come fai a evitare che qualcuno imbrogli o mandi informazioni sbagliate per sabotare il progetto?
Hanno creato un sistema basato su una blockchain (una sorta di registro pubblico digitale inattaccabile) chiamato Gauntlet.

  • La metafora: Immagina un giudice in una piazza che controlla ogni contributo. Se qualcuno invia un "riassunto" (i dati) che non ha senso o che sembra copiato, il giudice lo scarta e non paga quel partecipante. Se il contributo è buono, il partecipante viene ricompensato.
  • Il risultato: Non serve fidarsi di nessuno ("trustless"). Il sistema si auto-pulisce e premia solo chi lavora davvero.

3. La "Danza Dinamica"

In un progetto del genere, le persone possono staccarsi la corrente, andare a dormire o avere problemi al computer.

  • La metafora: Immagina una danza di gruppo dove, se qualcuno esce di scena, gli altri si riorganizzano istantaneamente per mantenere il ritmo, senza fermare la musica. Il sistema è stato progettato per gestire questi "vuoti" senza bloccarsi.

🏆 Il Risultato: Un gigante nato dal basso

Il risultato è Covenant-72B, un'intelligenza artificiale con 72 miliardi di parametri (un "cervello" enorme).

  • È stata addestrata leggendo circa 1,1 trilioni di parole (token) provenienti da internet.
  • È stata costruita da oltre 70 persone diverse (peer) che hanno contribuito con la loro potenza di calcolo.

È riuscita a competere?
Sì! Quando l'hanno messa alla prova su quiz di logica, matematica e cultura generale, ha ottenuto risultati paragonabili a modelli creati da grandi aziende come Meta (LLaMA) o LLM360, che hanno usato data center centralizzati e costosissimi.
In pratica, hanno dimostrato che non serve essere un gigante per creare un'intelligenza artificiale gigante.

💡 Perché è importante?

Fino a oggi, l'IA avanzata era un gioco per pochi ricchi. Covenant-72B ha aperto la porta a un futuro in cui:

  1. Democratizzazione: Chiunque può contribuire.
  2. Risparmio: Non servono miliardi di dollari in hardware centralizzato.
  3. Collaborazione: La conoscenza si costruisce insieme, come una Wikipedia vivente e intelligente.

In sintesi, questo paper ci dice che il futuro dell'Intelligenza Artificiale non sarà costruito in una sola torre di cristallo, ma potrebbe nascere dalla collaborazione di milioni di persone sparse per il mondo, collegate semplicemente dalla nostra rete internet quotidiana.