Training single-electron and single-photon stochastic physical neural networks

Diese Studie stellt neuartige stochastische neuronale Netzwerke auf Basis von Einzel-Elektronen-Tunneln und Einzel-Photonen-Quellen vor und zeigt, dass diese physikalischen Systeme trotz hoher Rauschpegel und Unsicherheiten durch geeignete Trainingsstrategien eine Testgenauigkeit von über 97 % bei der MNIST-Bilderkennung erreichen.

Ursprüngliche Autoren: Tong Dou, Shiro Kumara, Josh Burns, Ethan Sigler, Parth Girdhar, David Petty, Gerard Milburn, Jo Plested, Matt Woolley

Veröffentlicht 2026-04-14
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Tong Dou, Shiro Kumara, Josh Burns, Ethan Sigler, Parth Girdhar, David Petty, Gerard Milburn, Jo Plested, Matt Woolley

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Titel: Wie man Computer mit „Zufall" trainiert – Eine Reise durch die Welt der einzelnen Elektronen und Photonen

Stellen Sie sich vor, Sie wollen einen sehr intelligenten Roboter bauen, der Bilder erkennt (zum Beispiel Handschriften). Normalerweise tun wir das mit riesigen, digitalen Computern, die wie riesige Fabriken arbeiten: Sie verbrauchen viel Strom, werden heiß und müssen Milliarden von Rechenschritten durchlaufen.

Die Autoren dieses Papers haben eine andere Idee: Warum nicht die Natur selbst als Computer nutzen?

1. Das Grundproblem: Der laute Hintergrund

In der echten Welt ist nichts perfekt. Wenn Sie mit einem einzelnen Elektron (einem winzigen Teilchen) oder einem einzelnen Lichtteilchen (Photon) arbeiten, passiert etwas Seltsames: Alles ist zufällig.
Stellen Sie sich vor, Sie versuchen, einen Brief durch einen sehr engen, stürmischen Tunnel zu werfen. Manchmal landet er im Ziel, manchmal daneben. In herkömmlichen Computern versuchen wir, diesen „Sturm" (das Rauschen) zu unterdrücken. Aber die Autoren sagen: „Warum nicht den Sturm als Feature nutzen?"

Sie bauen neuronale Netze, die nicht deterministisch (festgelegt) sind, sondern stochastisch (zufällig). Das ist wie ein Würfel, der entscheidet, ob ein Neuron „aktiviert" wird oder nicht.

2. Die drei neuen „Zufalls-Würfel" (Die Neuronen)

Die Forscher haben drei verschiedene physikalische Systeme entwickelt, die als diese zufälligen Neuronen dienen:

  • Der Elektronen-Tunnel (SET):

    • Die Analogie: Stellen Sie sich einen winzigen Kasten (einen Quantenpunkt) vor, in den ein Elektron springen kann. Ob es hineinspringt oder nicht, hängt von einer Spannung ab, die wir steuern. Aber das Springen ist ein glücklicher Zufall, wie ein Münzwurf.
    • Die Funktion: Wenn das Elektron drin ist, ist das Neuron „1". Wenn nicht, ist es „0". Der Zufall ist hier das Herzstück.
  • Der Licht-Strahlteiler (SPD):

    • Die Analogie: Schicken Sie ein einzelnes Lichtteilchen auf einen Strahlteiler (einen Spiegel, der das Licht teilt). Es geht entweder links oder rechts raus. Wir wissen nicht vorher, wohin.
    • Die Funktion: Das Lichtdetektor-System zählt, ob ein Klick (1) oder kein Klick (0) passiert ist.
  • Der „Echte" Einzel-Photonen-Neuron (TSP):

    • Die Analogie: Das ist die High-Tech-Version. Ein einzelnes Lichtteilchen wird in ein System geschickt, das wie ein Tanz zwischen Licht und Schallwellen aussieht. Durch einen Kontrollknopf (die Eingabe) bestimmen wir, wie wahrscheinlich es ist, dass das Lichtteilchen in einen bestimmten „Tanzpartner" (eine mechanische Schwingung) springt.
    • Die Funktion: Auch hier entscheidet der Zufall am Ende, ob das System aktiv ist oder nicht.

3. Das große Rätsel: Wie lernt man, wenn man nichts genau weiß?

Das größte Problem beim Trainieren solcher Netze ist: Wie korrigiert man die Fehler?
In normalen Computern wissen wir genau: „Der Wert war 0,7, aber wir wollten 0,9." Wir können den Fehler berechnen und den Kurs korrigieren.
Bei diesen physikalischen Neuronen sehen wir aber nur das Ergebnis des Würfelns: „Es war 0 oder 1". Wir sehen nicht die Wahrscheinlichkeit dahinter. Es ist, als ob Sie einen Würfel werfen, nur das Ergebnis sehen, aber nicht wissen, ob der Würfel fair ist oder beschummelt.

Die Autoren haben drei Strategien entwickelt, um trotzdem zu lernen:

  • Strategie A: Die „Glaubens-Strategie" (True Probability)
    Hier nehmen wir an, wir könnten die Wahrscheinlichkeit berechnen (wie ein Mathematiker, der den Würfel im Kopf simuliert). Das funktioniert super, ist aber in der echten Hardware schwer zu messen. Es dient als Referenz.

  • Strategie B: Die „Schätzer-Strategie" (Empirical Gradient)
    Hier ist die Idee genial: Wir werfen den Würfel nicht nur einmal, sondern ein paar Mal (z. B. 5 Mal). Wenn er 3-mal „1" und 2-mal „0" zeigt, schätzen wir: „Okay, die Wahrscheinlichkeit liegt bei 60%." Wir nutzen diese Schätzung, um den Kurs zu korrigieren.

    • Ergebnis: Selbst mit sehr wenigen Würfen (wenigen Versuchen) lernt das Netz fast so gut wie mit der perfekten Mathematik.
  • Strategie C: Die „Durch-durch-Strategie" (Straight-Through)
    Hier sagen wir im Training einfach: „Vergiss den Zufall im Rückwärtsweg!" Wir tun so, als wäre der Würfelwurf eine glatte Kurve, damit wir den Fehler berechnen können. Das ist eine mathematische Abkürzung, die oft gut funktioniert, aber hier nicht die beste Leistung brachte.

4. Das Ergebnis: Zufall ist der neue Superheld

Die Forscher haben ihr System am klassischen Beispiel „Handschrift erkennen" (MNIST-Datensatz) getestet.

  • Das Wunder: Selbst wenn sie nur ein einziges Mal pro Schicht würfelten (also extrem wenig Daten und viel Zufall), erreichten sie eine Genauigkeit von über 97%.
  • Robustheit: Das System war so stark, dass es auch dann noch gut funktionierte, wenn die Hardware verrückt spielte (viel Rauschen, ungenaue Bauteile).

Fazit für den Alltag

Diese Arbeit zeigt uns etwas Tolles: Wir müssen nicht versuchen, die Natur perfekt zu beherrschen und jeden Zufall zu eliminieren. Stattdessen können wir die Unschärfe und den Zufall der Quantenwelt direkt in unsere Computer integrieren.

Stellen Sie sich vor, ein Computer, der nicht wie ein strenger Lehrer ist, der jede Regel genau befolgt, sondern wie ein kreativer Künstler, der mit Zufall arbeitet und trotzdem Meisterwerke schafft. Das könnte in Zukunft zu Computern führen, die extrem wenig Energie verbrauchen (da sie nur mit einzelnen Teilchen arbeiten) und trotzdem extrem intelligent sind.

Kurz gesagt: Die Autoren haben bewiesen, dass man mit „Zufallswürfeln" aus Elektronen und Lichtteilchen genauso gut rechnen kann wie mit riesigen, stromfressenden Supercomputern – und das ist ein riesiger Schritt in Richtung einer grüneren, effizienteren Zukunft der KI.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →