Ursprüngliche Autoren: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

Veröffentlicht 2026-06-02

📖 6 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Antonino Emanuele Scurria, Dimitri Vanden Abeele, Bortolo Matteo Mognetti, Serge Massar

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ✨ Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Das große Ganze: Eine Maschine lehren, ohne einen „Backward Pass“ zu benötigen

Stellen Sie sich vor, Sie versuchen, einem Roboter beizubringen, eine Katze auf einem Foto zu erkennen. Auf die heutige Standardmethode (genannt „Backpropagation“) angewendet, schaut der Roboter das Foto an, gibt eine Vermutung ab, stellt fest, dass er falsch liegt, und sendet dann ein „Korrektursignal“ den gesamten Weg zurück durch sein Gehirn, Schicht für Schicht, um seine Fehler zu korrigieren.

Das Problem ist, dass dieser „Backward Pass“ (Rückwärtslauf) in echten physischen Maschinen (wie biologischen Gehirnen oder Siliziumchips) sehr schwer zu bauen ist, da er erfordert, Informationen rückwärts in der Zeit oder über lange Distanzen instantan zu senden.

Equilibrium Propagation (EP) ist eine intelligentere, physischere Art zu lernen. Anstatt eines Rückwärtslaufs entspannt sich der Roboter einfach in einen „Ruhezustand“ (Gleichgewicht). Er probiert zwei leicht unterschiedliche Szenarien aus:

Freier Zustand (Free State): Der Roboter betrachtet das Bild und gibt ganz natürlich eine Vermutung ab.
Genachter Zustand (Nudged State): Jemand drückt die endgültige Vermutung des Roboters sanft in Richtung der richtigen Antwort.

Indem der Roboter vergleicht, wie sich sein Gehirn zwischen diesen beiden Ruhezuständen verändert hat, kann er genau herausfinden, wie er seine internen Einstellungen anpassen muss, um beim nächsten Mal besser zu werden. Es ist, als würde man daraus lernen, wie sich der Unterschied zwischen „was ich dachte“ und „wohin ich genudgt wurde“ anfühlt.

Das Problem: Die „Symmetrie“-Regel

Die ursprüngliche Version dieser Lernmethode (EP) funktionierte nur für Systeme, die einer strengen Regel folgen: Symmetrie.

Betrachten Sie ein konservatives System wie einen Ball, der einen glatten Hügel hinunterrollt. Wenn der Ball von Punkt A nach Punkt B rollt, wird der Pfad durch die Form des Hügels bestimmt. Wenn man den Pfad umkehrt, ist die Physik dieselbe. In einem Computergehirn bedeutet dies: Wenn Neuron A mit Neuron B kommuniziert, muss Neuron B mit exakt derscher Stärke zu Neuron A zurückkommunizieren.

Viele reale Systeme (und moderne KI-Modelle) sind jedoch nicht wie ein glatter Hügel. Sie sind wie ein Fluss mit einer Strömung oder eine Einbahnstraße.

Nicht-konservative Systeme: Informationen fließen in eine Richtung (wie in einem Feedforward-Netzwerk, bei dem die Daten von Input → Hidden → Output fließen, aber niemals rückwärts).
Das Problem: Die alte EP-Methode versagt in diesen Systemen. Sie versucht, die „Hügel-Mathematik“ auf einen „Fluss“ anzuwenden, wodurch die Lernberechnungen falsch werden. Der Roboter lernt die falschen Lektionen.

Die Lösung: Zwei neue Methoden

Die Autoren schlagen zwei neue Wege vor, um dies zu beheben, damit die Methode der „Equilibrium Propagation“ auch auf diesen einseitigen, nicht-symmetrischen Systemen funktioniert.

1. Asymmetrisches EP (AsymEP): Die „lokale Korrektur“

Stellen Sie sich vor, Sie versuchen, eine Waage zu balancieren, aber jemand fügt heimlich immer wieder Gewicht auf einer Seite hinzu (der nicht-symmetrische Teil). Die alte Methode ignoriert dies einfach und versucht trotzdem, die Waage zu balancieren, was fehlschlägt.

AsymEP fügt der Waage ein winziges, lokales „Gegengewicht“ hinzu.

Wie es funktioniert: Während der „Nudged“-Phase (wenn der Roboter in Richtung der richtigen Antwort gedrückt wird), fügt der Algorithmus einen speziellen Korrekturterm hinzu. Dieser Term wird basierend darauf berechnet, wie „einseitig“ oder „asymmetrisch“ die Verbindungen sind.
Die Analogie: Es ist wie ein Radfahrer, der mit einem platten Reifen fährt. Die alte Methode sagt ihm nur, er solle fester in die Pedale treten. AsymEP fügt eine kleine, lokale Anpassung am Lenker hinzu, um den platten Reifen zu kompensieren, damit er geradeaus fahren und korrekt lernen kann.
Das Ergebnis: Dies ermöglicht es dem System, das exakt korrekte Gradient (die richtige Lektion) zu berechnen, selbst wenn die Verbindungen einseitig sind.

2. Dyadisches EP: Der „Doppel-Gehirn“-Ansatz

Wenn AsymEP eine lokale Korrektur ist, dann ist Dyadic EP eine größere architektonische Änderung.

Die Analogie: Stellen Sie sich vor, Sie haben eine komplexe Maschine, die nur funktioniert, wenn Sie zwei identische Kopien davon nebeneinander laufen haben. Eine Kopie repräsentiert den „Vorwärtsfluss“, die andere den „Rückwärtsfluss“.
Wie es funktioniert: Der Algorithmus verdoppelt die Anzahl der Variablen im System. Er erschafft eine neue, größere „Energielandschaft“, in der die beiden Kopien miteinander interagieren. In diesem verdoppelten Raum verwandelt sich der chaotische, einseitige Fluss des ursprünglichen Systems wieder in einen glatten, symmetrischen Hügel.
Das Ergebnis: Da die Mathematik nun auf diesem „verdoppelten“ System basiert, ist das Lernen perfekt. Es ist ein wenig so, als würde man einen Spiegel benutzen, um eine Einbahnstraße wie eine Straße mit zwei Richtungen aussehen zu lassen, damit man die Standard-Verkehrsregeln anwenden kann.

Was sie getestet haben (Die Experimente)

Die Autoren haben diese Ideen nicht nur mathematisch durchgerechnet, sondern auch an realen Aufgaben der Bilderkennung (wie der Identifizierung handgeschriebener Ziffern oder Kleidung) getestet.

Symmetrischer Start: Sie begannen mit Netzwerken, die symmetrisch waren (wie das alte EP). AsymEP lernte schneller und erzielte bessere Ergebnisse als die alten Methoden.
Erzwungene Asymmetrie: Sie zwangen die Netzwerke dazu, sehr „einseitig“ (hochgradig asymmetrisch) zu sein.
- Die alte Methode (Vector Field) scheiterte kläglich und lieferte Ergebnisse, die nicht besser als Raten waren.
- AsymEP funktionierte weiterhin einwandfrei, selbst als das Netzwerk völlig einseitig war.
Feedforward-Netzwerke: Das ist der große Sieg. Moderne KI (wie die in Ihrem Telefon) ist meistens „feedforward“ (strikt einseitig). Das alte EP konnte diese gar nicht trainieren. AsymEP konnte diese Netzwerke erfolgreich trainieren und bewies damit, dass es die Architektur nutzen kann, die in der meisten modernen KI verwendet wird.
Deep Learning: Sie testeten ein komplexes Dataset (CIFAR-10) mit einem tiefen Netzwerk. AsymEP und Dyadic EP schnitten fast exakt so gut ab wie die Standardmethode „Backpropagation“, welche den Goldstandard darstellt.

Zusammenfassung

Das Problem: Die coole, „gehirnfreundliche“ Lernmethode „Equilibrium Propagation“ funktionierte nur auf symmetrischen Systemen, aber reale KI- und physische Systeme sind oft asymmetrisch (einseitig).
Die Lösung: Die Autoren entwickelten AsymEP (das eine lokale Korrektur zur Lernregel hinzufügt) und Dyadic EP (das die Systemgröße verdoppelt, um die Mathematik lauffähig zu machen).
Das Ergebnis: Diese neuen Methoden ermöglichen es diesem physischen, gehirnähnlichen Lernstil, auf denselben Arten von Netzwerken zu arbeiten, die auch in der modernen KI genutzt werden, und erzielen dabei Ergebnisse, die genauso gut sind wie die der schwieriger zu implementierenden Standardmethoden.

Kurz gesagt: Sie haben herausgefunden, wie man eine physische Maschine durch „Entspannung“ und „lokale Nudges“ lehrt, selbst wenn die interne Verdrahtung der Maschine strikt einseitig ist.

Technisches Resümee: Äquilibrium-Propagation für nicht-konservative Systeme

1. Problemstellung

Die Standardoptimierung neuronaler Netze beruht auf der Fehler-Backpropagation, die einen separaten Rückwärtslauf, nicht-lokale Fehlersignalübertragung und explizite Gradientenspeicherung erfordert. Diese Einschränkungen lassen sich nur schwer mit biologischer Plausibilität und physikalischen Implementierungen (z. B. neuromorpher oder analoger Hardware) vereinbaren, die typischerweise durch lokale Interaktionen und kontinuierliche Relaxation operieren.

Die Äquilibrium-Propagation (EP) bietet eine vielversprechende Alternative, indem sie das Lernen als Kontrast zwischen zwei stationären Zuständen eines dynamischen Systems formuliert: einer „freien“ Phase und einer „genudelten“ (nudged) Phase. Die ursprüngliche Formulierung der EP ist jedoch auf konservative Systeme beschränkt, bei denen die Dynamik aus einer Energiefunktion abgeleitet wird, was symmetrische Interaktionen (d. h. $J_{ij} = J_{ji}$ ) erzwingt. Diese Einschränkung verhindert die Anwendung der EP auf eine breite Klasse von Modellen, die durch nicht-konservative Kräfte und nicht-reziproke Interaktionen charakterisiert sind, einschließlich:

Moderner Feedforward-Architekturen (dominant in der KI).
Biologischer Schaltkreise.
Physikalischer Systeme fernab des thermodynamischen Gleichgewichts (z. B. nichtlineare optische Systeme, aktive Materie, Exzitonen-Polariton-Kondensate).

Frühere Versuche, die EP auf nicht-konservative Systeme zu verallgemeinern, wie etwa der Vector Field (VF) Algorithmus, scheitern daran, den exakten Gradienten der Kostenfunktion zu berechnen. Sie liefern nur einen erwartungstreuen Gradienten im konservativen Grenzfall; wenn der antisymmetrische Teil der Jacobi-Matrix zunimmt, wächst der Schätzfehler des Gradienten, was potenziell zum Optimierungsfehler führt (z. B. Maximierung der Kosten statt Minimierung).

2. Methodik

Die Autoren schlagen zwei mathematisch äquivalente Frameworks vor, um die EP auf beliebige nicht-konservative Systeme zu erweitern: Asymmetrische EP (AsymEP) und Dyadische EP. Beide Methoden behalten das Kernprinzip der EP bei, stationäre Zustände für Inferenz und Lernen zu nutzen, modifizieren jedoch die Dynamik, um den exakten Gradienten wiederherzustellen.

2.1 Asymmetrische EP (AsymEP)

AsymEP bewahrt die ursprüngliche Inferenzdynamik, führt aber während der „genudelten“ Phase einen lokalen Korrekturterm ein.

Mechanismus: In der genudelten Phase entwickelt sich das System unter einem erweiterten Kraftfeld. Dieses Feld umfasst die ursprüngliche Kraft $F$ , den Standard-Nudging-Term $-\beta \frac{\partial C}{\partial x}$ und einen neuen Korrekturterm, der proportional zum antisymmetrischen Teil der Jacobi-Matrix ( $A_J$ ) am freien Gleichgewicht ist:
$\frac{dx}{dt} = F(x, \theta) - \beta \frac{\partial C}{\partial x} - 2A_J(x_0, \theta)(x - x_0)$
Gradientenwiederherstellung: Diese Korrektur transponiert effektiv die Jacobi-Matrix in der Lernregel, wodurch sichergestellt wird, dass der Unterschied zwischen dem genudelten und dem freien stationären Zustand den exakten postsynaptischen Term für den wahren Gradienten liefert.
Lokalität: Der Korrekturterm ist räumlich lokal, da $A_J$ für nicht verbundene Neuronen verschwindet und der Zustandsunterschied $(x - x_0)$ an der Synapse verfügbar ist.

2.2 Dyadische EP

Die dyadische EP ist ein variationstheoretischer Ansatz, der die nicht-konservative Dynamik auf ein konservatives System abbildet, indem der Zustandsraum verdoppelt wird.

Mechanismus: Das ursprüngliche $n$ -Variablen-System wird auf ein $2n$ -Variablen-System $(z, z')$ abgebildet, das durch eine Energiefunktion $H(z, z', \theta)$ und eine Kostenfunktion $D(z, z')$ definiert ist. Die Energiefunktion wird so konstruiert, dass die ursprüngliche Dynamik auf der Diagonale ( $z=z'$ ) wiederhergestellt wird, während die Off-Diagonal-Richtung die nicht-reziproken Kräfte kodiert.
$H(z, z', \theta) = -(z - z')^\top F\left(\frac{z + z'}{2}, \theta\right)$
Lernen: Das System entwickelt sich zu einem Sattelpunkt der erweiterten Energie $H_T = H + \beta D$ . Der Unterschied $z_\beta - z'_\beta$ dient als Fehlersignal.
Beziehung zu AsymEP: AsymEP kann als Projektion erster Ordnung der dyadischen EP auf den ursprünglichen $n$ -dimensionalen Raum betrachtet werden. Die dyadische EP ermöglicht eine parallele Ausführung der positiven und negativen Nudging-Phasen, erfordert jedoch die Verdopplung der physikalischen Freiheitsgrade.

3. Zentrale Beiträge

Exakte Gradientenberechnung: Die Arbeit liefert das erste Framework zur Berechnung des exakten Gradienten der Kostenfunktion für beliebige nicht-konservative dynamische Systeme mittels Äquilibrium-Propagation und überwindet damit die Einschränkungen des Vector Field Algorithmus.
Zwei Verallgemeinerungen: Sie führt die Asymmetrische EP (eine direkte Modifikation der Dynamik mit einer lokalen Korrektur) und die Dyadische EP (eine Variation durch Verdopplung des Zustandsraums) ein und beweist deren Äquivalenz im Grenzfall des infinitesimalen Nudgings.
Feedforward-Fähigkeit: Die Methoden ermöglichen das Training rein Feedforward-basierter Netzwerke – ein Szenario, in dem frühere EP-basierte Methoden (wie VF) versagen, da sie keine Fehlersignale ohne explizite Rückwärtsverbindungen propagieren können.
Theoretische Vereinheitlichung: Die Arbeit zeigt, dass das hinter der EP stehende Variationsprinzip universell ist und auf nicht-reziproke Kräfte angewendet werden kann, indem man den Zustandsraum erweitert oder die Dynamik modifiziert, wodurch die Lücke zwischen energiebasierten Modellen und allgemeinen dynamischen Systemen geschlossen wird.

4. Experimentelle Ergebnisse

Die Autoren validieren ihr Framework auf MNIST, Fashion-MNIST und CIFAR-10 unter Verwendung kontinuierlicher Hopfield-Netzwerke und konvolutionaler Architekturen.

Symmetrische Initialisierung: Auf MNIST mit symmetrischer Initialisierung erreicht AsymEP eine höhere Genauigkeit und lernt schneller als sowohl die Standard-EP als auch der Vector Field (VF) Algorithmus.
Strukturelle Asymmetrie: Wenn das Netzwerk gezwungen ist, eine hohe strukturelle Asymmetrie aufzuweisen (wo EP nicht anwendbar ist und VF degradiert):
- VF-Leistung: Die Leistung von VF bricht mit zunehmender Asymmetrie zusammen und sinkt auf Zufallsniveau (z. B. ~10 % Genauigkeit auf MNIST bei hoher Asymmetrie).
- AsymEP-Leistung: AsymEP behält eine robuste Leistung über alle Asymmetrie-Level hinweg bei, einschließlich vollständig antisymmetrischer Konnektionsmatrizen.
Feedforward-Architekturen:
- In einem rein Feedforward-Setting trainiert VF effektiv nur die letzte Schicht (wirkt wie eine Extreme Learning Machine), was zu einer schlechten Leistung führt (~64 % auf MNIST).
- AsymEP trainiert erfolgreich alle Schichten und erreicht ~92,7 % Genauigkeit auf MNIST.
Tiefe Netzwerke (CIFAR-10): Auf einem tiefen konvolutionalen Netzwerk, das auf CIFAR-10 trainiert wurde, folgen sowohl AsymEP als auch die dyadische EP eng der Leistung der Standard-Backpropagation (BP) und erreichen ~89,7 % bzw. ~90,7 %, verglichen mit den 90,7 % der BP. Im Gegensatz dazu bricht VF auf Zufallsniveau zusammen.
Stabilität: Experimente deuten darauf an, dass mit AsymEP trainierte nicht-konservative Dynamiken Oszillationen unterdrücken können und selbst unter starker Asymmetrie und eingeschränkten Input-Projektionen stabil bleiben.

5. Bedeutung und Ansprüche

Die Autoren behaupten, dass diese Arbeit neue Wege für das Lernen in neuromorpher Hardware, dissipativen physikalischen Systemen und neuronalen Architekturen eröffnet, in denen Asymmetrie intrinsisch statt zufällig ist.

Physikalische Implementierbarkeit: Durch die Entfernung der Anforderung an Gewichtssymmetrie und explizite Rückwärtsläufe sind die vorgeschlagenen Algorithmen kompatibler mit physikalischen Substraten (z. B. Memristoren, optische Systeme, aktive Materie), die natürlicherweise nicht-konservative Dynamiken aufweisen.
Biologische Plausibilität: Die Methoden beruhen auf lokalen Interaktionen und kontinuierlicher Relaxation, was einen biologisch plausibleren Mechanismus für die Credit Assignment im Vergleich zur Backpropagation bietet.
Universalität: Die dyadische EP-Formulierung legt nahe, dass die variationstheoretischen Prinzipien der Äquilibrium-Propagation universell sind und auf jedes Netzwerk anwendbar sind, das in einem stationären Zustand operiert, unabhängig davon, ob die zugrunde liegenden Kräfte konservativ oder nicht-konservativ sind.

Das Paper schließt mit dem Hinweis, dass die AsymEP zwar eine lokale Korrekturkraft einführt, die spezifische physikalische Mechanismen für die Implementierung erfordern mag, und die dyadische EP zwar den Zustandsraum verdoppelt, beide jedoch einen rigorosen theoretischen und praktischen Weg zum Training nicht-konservativer Systeme mit exakten Gradienten bieten.

Equilibrium Propagation for Non-Conservative Systems