Machine-learned, finite temperature Fermi-operator expansions suitable for GPUs and AI-hardware

Dieser Beitrag stellt eine durch maschinelles Lernen verbesserte, bei endlichen Temperaturen angewandte rekursive Fermi-Operator-Entwicklungsmethode vor, die auf dem SP2-Schema basiert, elektronische Strukturberechnungen auf tiefe neuronale Netzarchitekturen abbildet und durch Nutzung optimierter Matrix-Matrix-Multiplikationen sowie affiner Skalierung, um eine explizite Diagonalisierung und ein erneutes Modelltraining zu vermeiden, eine Beschleunigung um Größenordnungen auf GPUs und KI-Hardware ermöglicht.

Ursprüngliche Autoren: Stanislaw Kowalski, Christian F. A. Negre, Anders M. N. Niklasson, Kipton Barros, Joshua Finkelstein

Veröffentlicht 2026-05-12
📖 5 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Stanislaw Kowalski, Christian F. A. Negre, Anders M. N. Niklasson, Kipton Barros, Joshua Finkelstein

Originalarbeit unter CC0 1.0 der Gemeinfreiheit gewidmet (http://creativecommons.org/publicdomain/zero/1.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Das große Ganze: Ein schnellerer Weg, Atome zu simulieren

Stellen Sie sich vor, Sie versuchen vorherzusagen, wie sich eine Menschenmenge (Elektronen) in einem Raum (ein Material) bewegt und interagiert. In der Welt der Quantenphysik ist dies unglaublich schwierig. Um die exakte Antwort zu erhalten, müssen Sie normalerweise ein riesiges, komplexes Rätsel lösen, das „Diagonalisierung" heißt.

Denken Sie an Diagonalisierung wie den Versuch, eine Million Bücher zu sortieren, indem Sie jede einzelne Seite jedes Buches lesen, um die richtige Reihenfolge zu finden. Es ist genau, aber es dauert lange, besonders wenn der Raum größer wird.

Die Autoren dieses Papers haben einen Abkürzungsweg entwickelt. Anstatt jede Seite zu lesen, haben sie eine „intelligente Schätzmachine" erstellt, die lernt, die Bücher fast augenblicklich zu sortieren. Sie nennen dies eine maschinell gelernte Fermi-Operator-Entwicklung.

Das Problem: Heiße vs. kalte Menschenmengen

In der Vergangenheit funktionierten diese Abkürzungen nur dann gut, wenn die „Menschenmenge" sehr kalt war (Nulltemperatur). In einer kalten Menge steht jeder in einer sehr vorhersehbaren Reihe still. Die Mathematik ist einfach: Man ist entweder in der Reihe oder man ist es nicht.

In der realen Welt sind Dinge jedoch oft „heiß". Wenn Elektronen heiß werden, werden sie unruhig. Manche Leute, die in der Reihe standen, treten vielleicht aus, und manche, die warteten, treten ein. Dies erzeugt eine „verschwommene" Grenze, bei der Menschen teilweise drin und teilweise draußen sind.

Frühere Abkürzungen scheiterten hier, weil sie zu starr waren. Sie konnten die „Verschwommenheit" einer heißen Menge nicht bewältigen.

Die Lösung: Einem neuronalen Netz beibringen, zu „quetschen"

Die Autoren erkannten, dass die Mathematik, die verwendet wird, um die kalte Menge zu sortieren, exakt der Struktur eines tiefen neuronalen Netzwerks (der Art von KI, die Gesichter erkennt oder Gedichte schreibt) entspricht.

  • Der alte Weg (SP2): Stellen Sie sich eine Maschine vor, die eine Zahl nimmt und entweder quadriert (x2x^2) oder eine spezifische Subtraktion durchführt (2xx22x - x^2). Sie wiederholt dies immer wieder und „quetscht" die Zahlen, bis sie entweder 0 oder 1 werden. Dies funktioniert hervorragend für kalte Mengen.
  • Der neue Weg (MLSP2): Die Autoren nahmen diese Maschine und gaben ihr ein „Gehirn". Anstatt feste Regeln zu verwenden, trainierten sie die Maschine mittels Maschinellem Lernen. Sie lehrten sie, ihre eigenen internen Regler (Koeffizienten) anzupassen, damit sie die „verschwommene" heiße Menge perfekt bewältigen konnte.

Stellen Sie es sich so vor:

  • Alte Maschine: Ein starrer Stempel, der nur „Ja" oder „Nein" druckt.
  • Neue Maschine: Ein flexibler 3D-Drucker, der lernt, genau wie er das „Ja" und „Nein" formen muss, um je nach Hitze der Menge eine glatte, perfekte Kurve dazwischen zu erzeugen.

Der magische Trick: Ein Modell passt zu vielen Temperaturen

Normalerweise müssen Sie Ihr KI-Modell von Grund auf neu trainieren, wenn Sie die Temperatur Ihrer Simulation ändern. Das dauert ewig.

Die Autoren entdeckten einen cleveren Trick namens Affine Reskalierung.
Stellen Sie sich eine Stadtkarte vor. Wenn Sie hinein- oder herauszoomen wollen, müssen Sie nicht die ganze Stadt neu zeichnen; Sie dehnen oder verkleinern einfach die Karte.

Die Autoren stellten fest, dass sie ihr KI-Modell nur einmal für einen bestimmten „Zoom-Level" (eine bestimmte Temperatur und ein bestimmtes chemisches Potential) trainieren konnten. Dann konnten sie für jede andere Temperatur innerhalb eines bestimmten Bereichs die Eingabedaten (die Hamilton-Matrix) einfach „dehnen", bevor sie sie dem Modell zuführten. Das Modell muss nichts neu lernen; es sieht die Daten nur in einem leicht anderen Maßstab und liefert die korrekte Antwort.

Das bedeutet, dass sie Simulationen durchführen können, bei denen sich die Temperatur ständig ändert (wie in einer chemischen Reaktion), ohne das KI-Modell neu trainieren zu müssen.

Die Hardware: KI-Chips für die Wissenschaft nutzen

Das Paper hebt hervor, dass diese Methode speziell für moderne Computerchips entwickelt wurde, insbesondere für GPUs (Grafikprozessoren) und Tensor Cores (Chips, die für KI entwickelt wurden).

  • Die Analogie: Die traditionelle Diagonalisierung ist wie ein Meisterhandwerker, der jedes Möbelstück von Hand schnitzt. Es ist präzise, aber langsam.
  • Die neue Methode: Dies ist wie die Verwendung eines Hochgeschwindigkeits-3D-Druckers. Sie nutzt die spezifische Architektur von KI-Chips, um massive Berechnungen (Matrixmultiplikationen) unglaublich schnell durchzuführen.

Die Autoren testeten dies auf einer Nvidia RTX 6000 Ada GPU. Sie stellten fest, dass ihre Methode 9 bis 16 Mal schneller war als die Standardmethoden, die heute von Wissenschaftlern verwendet werden und die hochgradig optimiert sind, während sie gleichzeitig eine hohe Genauigkeit beibehielten.

Zusammenfassung der Ergebnisse

  1. Geschwindigkeit: Sie erzielten eine massive Beschleunigung (bis zu 16-fach) bei der Berechnung, wie sich Elektronen in Materialien verhalten, insbesondere auf moderner KI-Hardware.
  2. Genauigkeit: Sie können „heiße" Elektronen (fraktionale Besetzung) mit extremer Präzision modellieren, etwas, das frühere Abkürzungen nicht gut bewältigen konnten.
  3. Effizienz: Indem sie das Modell einmal trainieren und mathematische Tricks zur Reskalierung der Eingaben verwenden, vermeiden sie die Notwendigkeit, das Modell bei jeder Temperaturänderung in einer Simulation neu zu trainieren.
  4. Keine „magische" Diagonalisierung: Sie umgehen die langsame, schwere Mathematik der Diagonalisierung vollständig und verlassen sich stattdessen auf schnelle, wiederholte Multiplikationsschritte, die KI-Chips gerne ausführen.

Kurz gesagt: Die Autoren haben einen langsamen, starren mathematischen Prozess in ein schnelles, flexibles, KI-gestütztes Werkzeug verwandelt, das auf modernen Computerchips unglaublich effizient läuft und es Wissenschaftlern ermöglicht, komplexe Materialien viel schneller als zuvor zu simulieren.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →