Autori originali: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

Pubblicato 2026-06-02

📖 6 min di lettura🧠 Approfondimento

Autori originali: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

Articolo originale sotto licenza CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ✨ Questa è una spiegazione generata dall'IA dell'articolo qui sotto. Non è stata scritta né approvata dagli autori. Per precisione tecnica, consulta l'articolo originale. Leggi il disclaimer completo

Il quadro generale: Insegnare a una macchina senza un "passaggio all'indietro"

Immagina di cercare di insegnare a un robot a riconoscere un gatto in una foto. Nel modo standard in cui lo facciamo oggi (chiamato "Backpropagation"), il robot guarda la foto, fa un tentativo, si rende conto di aver sbagliato e poi invia un "segnale di correzione" attraverso tutto il suo cervello, strato dopo strano, per correggere i suoi errori.

Il problema è che questo "passaggio all'indietro" (backward pass) è molto difficile da costruire in macchine fisiche reali (come i cervelli biologici o i chip al silicio) perché richiede l'invio di informazioni indietro nel tempo o attraverso lunghe distanze istantaneamente.

L'Equilibrium Propagation (EP) è un modo più intelligente e fisico di apprendere. Invece di un passaggio all'indietro, il robot si rilassa semplicemente in uno "stato calmo" (equilibrio). Prova due scenari leggermente diversi:

Stato Libero (Free State): Il robot guarda l'immagine e indovina naturalmente.
Stato Stimolato (Nudged State): Qualcuno spinge delicatamente la risposta finale del robot verso la risposta corretta.

Confrontando come il cervello del robot è cambiato tra questi due stati calmi, può capire esattamente come regolare le sue impostazioni interne per migliorare la prossima volta. È come imparare percependo la differenza tra "ciò che pensavo" e "ciò verso cui sono stato spinto".

Il Problema: La regola della "Simmetria"

La versione originale di questo metodo di apprendimento (EP) funzionava solo per sistemi che seguono una regola stretta: la Simmetria.

Pensa a un sistema conservativo come a una palla che rotola su una collina liscia. Se la palla rotola dal punto A al punto B, il percorso che compie è determinato dalla forma della collina. Se inverti il percorso, la fisica è la stessa. In un cervello informatico, questo significa che se il Neurone A parla con il Neurone B, il Neurone B deve parlare con il Neurone A con la stessa identica forza.

Tuttavia, molti sistemi del mondo reale (e i modelli di IA moderna) non sono come una collina liscia. Sono come un fiume con una corrente o una strada a senso unico.

Sistemi Non Conservativi: L'informazione fluisce in una sola direzione (come in una rete feedforward dove i dati vanno da Input → Hidden → Output, ma mai all'indietro).
Il Problema: Il vecchio metodo EP fallisce in questi sistemi. Tenta di applicare la matematica della "collina" a un "fiume", e i calcoli dell'apprendimento diventano errati. Il robot impara lezioni sbagliate.

La Soluzione: Due nuovi metodi

Gli autori propongono due nuovi modi per risolvere questo problema, permettendo al metodo "Equilibrium Propagation" di funzionare su questi sistemi asimmetrici o a senso unico.

1. Asymmetric EP (AsymEP): La "correzione locale"

Immagina di cercare di bilanciare una bilancia, ma qualcuno continua ad aggiungere segretamente del peso su un lato (la parte non simmetrica). Il vecchio metodo si limita a ignorarlo e cerca comunque di bilanciarlo, fallendo.

AsymEP aggiunge un piccolo "contrappeso" locale alla bilancia.

Come funziona: Durante la fase di "Stimolazione" (quando il robot viene spinto verso la risposta corretta), l'algoritmo aggiunge un termine di correzione speciale. Questo termine è calcolato in base a quanto esattamente le connessioni siano "sbilanciate" o "non simmetriche".
L'analogia: È come un ciclista che percorre una strada con una gomma sgonfia. Il vecchio metodo si limita a dirgli di pedalare più forte. AsymEP aggiunge una piccola regolazione locale al manubrio per compensare la gomma sgonfia, permettendogli di andare dritto e imparare correttamente.
Risultato: Questo permette al sistema di calcolare il gradiente esatto (la lezione corretta) anche quando le connessioni sono unidirezionali.

2. Dyadic EP: L'approccio del "Doppio Cervello"

Se AsymEP è una correzione locale, Dyadic EP è un cambiamento architettonico più grande.

L'analogia: Immagina di avere una macchina complessa che funziona solo se hai due copie identiche che lavorano fianco a fianco. Una copia rappresenta il flusso "in avanti", e l'altra rappresenta il flusso "all'indietro".
Come funziona: L'algoritmo raddoppia il numero di variabili del sistema. Crea un nuovo "paesaggio energetico" più ampio dove le due copie interagiscono. In questo spazio raddoppiato, il flusso disordinato e unidirezionale del sistema originale si trasforma nuovamente in una collina simmetrica e liscia.
Il Risultato: Poiché la matematica ora opera su questo sistema "raddoppiato", l'apprendimento è perfetto. È un po' come usare uno specchio per far sembrare una strada a senso unico una strada a doppio senso, così da poter applicare le normali regole del traffico.

Cosa hanno testato (Gli esperimenti)

Gli autori non si sono limitati alla matematica; hanno testato queste idee su compiti reali di riconoscimento di immagini (come identificare cifre scritte a mano o capi d'abbigliamento).

Inizio Simmetrico: Sono partiti con reti che erano simmetriche (come il vecchio EP). AsymEP ha imparato più velocemente e ha ottenuto risultati migliori rispetto ai vecchi metodi.
Asimmetria Forzata: Hanno forzato le reti a essere molto "unidirezionali" (altamente asimmetriche).
- Il vecchio metodo (Vector Field) è fallito miseramente, ottenendo risultati non migliori del caso casuale.
- AsymEP ha continuato a funzionare perfettamente, anche quando la rete era completamente unidirezionale.
Reti Feedforward: Questa è la grande vittoria. L'IA moderna (come quella nei vostri telefoni) è solitamente "feedforward" (strettamente unidirezionale). Il vecchio EP non riusciva affatto ad addestrare queste reti. AsymEP ha addestrato con successo queste reti, dimostrando di poter gestire l'architettura usata nella maggior parte dell'IA moderna.
Deep Learning: Hanno testato su un dataset complesso (CIFAR-10) con una rete profonda. AsymEP e Dyadic EP hanno performato quasi esattamente come il metodo standard "Backpropagation", che è il punto di riferimento del settore.

Riassunto

Il Problema: Il metodo di apprendimento "Equilibrium Propagation" funzionava solo su sistemi simmetrici, ma l'IA e i sistemi fisici reali sono spesso asimmetrici (unidirezionali).
La Soluzione: Gli autori hanno creato AsymEP (che aggiunge una correzione locale alla regola di apprendimento) e Dyadic EP (che raddoppia la dimensione del sistema per far funzionare la matematica).
L'Esito: Questi nuovi metodi permettono questo stile di apprendimento fisico e "amichevole per il cervello" di operare sulle stesse tipologie di reti utilizzate nell'IA moderna, ottenendo risultati validi quanto quelli dei metodi standard, che però sono più difficili da implementare.

In breve, hanno capito come insegnare a una macchina fisica usando il "rilassamento" e le "piccole spinte locali", anche quando il cablaggio interno della macchina è strettamente unidirezionale.

Riassunto Tecnico: Propagazione dell'Equilibrio per Sistemi Non Conservativi

1. Definizione del Problema

L'ottimizzazione delle reti neurali standard si basa sulla backpropagation dell'errore, che richiede un passaggio di retropropagazione distinto, la trasmissione di segnali di errore non locali e l'archiviazione esplicita del gradiente. Questi vincoli sono difficili da conciliare con la plausibilità biologica e le implementazioni fisiche (ad esempio, hardware neuromorfico o analogico), che tipicamente operano attraverso interazioni locali e rilassamento continuo.

La Propagazione dell'Equilibrio (EP) offre un'alternativa promettente formulando l'apprendimento come un contrasto tra due stati stazionari di un sistema dinamico: una fase "libera" e una fase "perturbata" (nudged). Tuttavia, la formulazione originale di EP è limitata ai sistemi conservativi, dove la dinamica deriva da una funzione di energia, imponendo interazioni simmetriche (ad esempio, $J_{ij} = J_{ji}$ ). Questo limite preclude l'applicazione di EP a una vasta classe di modelli caratterizzati da forze non conservative e interazioni non reciproche, tra cui:

Architetture feedforward moderne (dominanti nell'IA).
Circuiti biologici.
Sistemi fisici lontani dall'equilibrio termodinamico (ad esempio, sistemi ottici non lineari, materia attiva, condensati di eccitoni-polaritoni).

I precedenti tentativi di generalizzare l'EP a sistemi non conservativi, come l'algoritmo Vector Field (VF), falliscono nel calcolare il gradiente esatto della funzione di costo. Forniscono un gradiente non distorto solo nel limite conservativo; man mano che la parte antisimmetrica dello Jacobiano aumenta, l'errore di stima del gradiente cresce, portando potenzialmente al fallimento dell'ottimizzazione (ad esempio, massimizzando il costo invece di minimizzarlo).

2. Metodologia

Gli autori propongono due framework matematicamente equivalenti per estendere l'EP a sistemi non conservativi arbitrari: Asymmetric EP (AsymEP) e Dyadic EP. Entrambi i metodi mantengono il principio fondamentale dell'EP di utilizzare stati stazionari per l'inferenza e l'apprendimento, ma modificano la dinamica per recuperare il gradiente esatto.

2.1 Asymmetric EP (AsymEP)

AsymEP preserva la dinamica di inferenza originale ma introduce un termine correttivo locale durante la fase "perturbata".

Meccanismo: Nella fase perturbata, il sistema evolve sotto un campo di forze aumentato. Questo campo include la forza originale $F$ , il termine di perturbazione standard $-\beta \frac{\partial C}{\partial x}$ e un nuovo termine di correzione proporzionale alla parte antisimmetrica dello Jacobiano ( $A_J$ ) all'equilibrio libero:
$\frac{dx}{dt} = F(x, \theta) - \beta \frac{\partial C}{\partial x} - 2A_J(x_0, \theta)(x - x_0)$
Recupero del Gradiente: Questa correzione traspone efficacementamente lo Jacobiano nella regola di apprendimento, garantendo che la differenza tra lo stato stazionario perturbato e quello libero fornisca il termine post-sinaptico esatto richiesto per il vero gradiente.
Località: Il termine di correzione è spazialmente locale perché $A_J$ svanisce per neuroni non connessi, e la differenza di stato $(x - x_0)$ è disponibile alla sinapsi.

2.2 Dyadic EP

Il Dyadic EP è un approccio variazionale che mappa le dinamiche non conservative su un sistema conservativo tramite il raddoppio dello spazio degli stati.

Meccanismo: Il sistema originale a $n$ variabili viene mappato su un sistema a $2n$ variabili $(z, z')$ definito da una funzione di energia $H(z, z', \theta)$ e una funzione di costo $D(z, z')$ . La funzione di energia è costruita in modo che le dinamiche originali siano recuperate sulla diagonale ( $z=z'$ ), mentre la direzione off-diagonal codifica le forze non reciproche.
$H(z, z', \theta) = -(z - z')^\top F\left(\frac{z + z'}{2}, \theta\right)$
Apprendimento: Il sistema evolve verso un punto di sella dell'energia aumentata $H_T = H + \beta D$ . La differenza $z_\beta - z'_\beta$ funge da segnale di errore.
Relazione con AsymEP: AsymEP può essere visto come la proiezione del primo ordine di Dyadic EP sullo spazio originale a $n$ dimensioni. Dyadic EP permette l'esecuzione parallela delle fasi di perturbazione positiva e negativa, ma richiede il raddoppio dei gradi di libertà fisici.

3. Contributi Chiave

Calcolo del Gradiente Esatto: Il documento fornisce il primo framework per calcolare il gradiente esatto della funzione di costo per arbitrarie dinamiche non conservative utilizzando la propagazione dell'equilibrio, superando i limiti dell'algoritmo Vector Field.
Due Generalizzazioni: Introduce AsymEP (una modifica diretta della dinamica con una correzione locale) e Dyadic EP (un raddoppio variazionale dello spazio degli stati), dimostrando la loro equivalenza nel limite di perturbazione infinitesima.
Capacità Feedforward: Questi metodi consentono l'addestramento di reti puramente feedforward, uno scenario in cui i precedenti metodi basati su EP (come VF) falliscono perché non possono propagare i segnali di errore all'indietro senza connessioni di retropropagazione esplicite.
Unificazione Teorica: Il lavoro dimostizza che il principio variazionale dietro l'EP è universale e può essere applicato a forze non reciproche estendendo lo spazio degli stati o modificando la dinamica, colmando il divario tra modelli basati sull'energia e sistemi dinamici generali.

4. Risultati Sperimentali

Gli autori validano il loro framework su MNIST, Fashion-MNIST e CIFAR-10 utilizzando reti di Hopfield continue e architetture convoluzionali.

Inizializzazione Simmetrica: Su MNIST con inizializzazione simmetrica, AsymEP raggiunge un'accuratezza superiore e apprende più velocemente sia rispetto all'EP standard che all'algoritmo Vector Field (VF).
Asimmetria Strutturale: Quando la rete è vincolata ad avere un alto grado di asimmetria strutturale (dove l'EP è inapplicabile e il VF degrada):
- Performance di VF: Le prestazioni di VF crollano all'aumentare dell'asimmetria, scendendo a livelli casuali (ad esempio, ~10% di accuratezza su MNIST ad alta asimmetria).
- Performance di AsymEP: AsymEP mantiene prestazioni robuste attraverso tutti i livelli di asimmetria, incluse le matrici di connessione completamente antisimmetriche.
Architetture Feedforward:
- In un contesto puramente feedforward, il VF addestra efficacementamente solo l'ultimo strato (agendo come una Extreme Learning Machine), con prestazioni scarse (~64% su MNIST).
- AsymEP addestra con successo tutti gli strati, raggiungendo circa il 92,7% di accuratezza su MNIST.
Reti Profonde (CIFAR-10): Su una rete convoluzionale profonda addestrata su CIFAR-10, sia AsymEP che Dyadic EP seguono da vicino le prestazioni della Backpropagation (BP) standard, raggiungendo rispettivamente ~89,7% e ~90,7% di accuratezza, rispetto al 90,7% di BP. Al contrario, VF crolla a un livello casuale.
Stabilità: Gli esperimenti suggeriscono che le dinamiche non conservative addestrate con AsymEP possono sopprimere le oscillazioni e rimanere stabili anche sotto forte asimmetria e proiezioni di input vincolate.

5. Significato e Rivendicazioni

Gli autori affermano che questo lavoro apre nuove strade per l'apprendimento in hardware neuromorfico, sistemi fisici dissipativi e architetture neurali dove l'asimmetria è intrinseca piuttosto che incidentale.

Implementabilità Fisica: Rimuovendo il requisito della simmetria dei pesi e della retropropagazione esplicita, i algoritmi proposti sono più compatibili con substrati fisici (ad esempio, memristori, sistemi ottici, materia attiva) che mostrano naturalmente dinamiche non conservative.
Plausibilità Biologica: I metodi si basano su interazioni locali e rilassamento continuo, offrendo un meccanismo più biologicamente plausibile per l'assegnazione del credito rispetto alla backpropagation.
Universalità: La formulazione Dyadic EP suggerisce che i principi variazionali dell'equilibrio sono universali, applicabili a qualsiasi rete che operi in uno stato stazionario, indipendentemente dal fatto che le forze sottostanti siano conservative o non conservative.

Il documento conclude che, sebbene AsymEP introduca una forza correttiva locale che potrebbe richiedere meccanismi fisici specifici per l'implementazione, e Dyadic EP richieda il raddoppio dello spazio degli stati, entrambi forniscono un percorso teorico e pratico rigoroso per l'addestramento di sistemi non conservativi con gradienti esatti.

Equilibrium Propagation for Non-Conservative Systems