Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen
Stellen Sie sich vor, Sie versuchen, das menschliche Gehirn auf einem Computer zu simulieren. Das Gehirn ist eine massive Stadt mit etwa 86 Milliarden Neuronen, wobei jedes Neuron ein Haus ist, das jede Sekunde winzige elektrische „Textnachrichten" (sogenannte Spikes) an Tausende anderer Häuser sendet. Um dies zu simulieren, benötigen Sie einen Supercomputer mit Tausenden von Grafikkarten (GPUs), die zusammenarbeiten.
Das Problem ist, dass diese GPUs wie Inseln sind. Sie sind schnell, sprechen aber nicht leicht miteinander. Wenn eine Insel eine Nachricht an eine andere senden möchte, muss der „Briefträger" (das Kommunikationssystem) hin und her laufen, was alles verlangsamt.
Diese Arbeit stellt eine neue, viel schnellere Methode vor, um die Karte dieser Verbindungen bevor die Simulation beginnt zu erstellen, damit die GPUs die Simulation ausführen können, ohne im Verkehr stecken zu bleiben.
So haben sie es gemacht, einfach erklärt:
1. Der alte Weg: Die Karte auf dem Festland erstellen
Früher, wenn Wissenschaftler ein Gehirnnetzwerk simulieren wollten, erstellten sie die „Verbindungskarte" zuerst auf dem langsamen, zentralen Computer (der CPU). Dann mussten sie diese riesige Karte auf die schnellen GPUs kopieren.
- Die Analogie: Stellen Sie sich vor, Sie organisieren eine massive Party. Bei der alten Methode schrieben Sie den Namen jedes einzelnen Gastes und wen er kennt auf ein Stück Papier in der Küche (CPU) und liefen dann in jeden einzelnen Raum (GPU), um ihnen eine Kopie der Liste zu übergeben. Dies nahm nur für die Vorbereitung sehr lange Zeit in Anspruch.
2. Der neue Weg: Die Karte innerhalb der Räume erstellen
Die Autoren entwickelten eine neue Methode, bei der jede GPU ihren eigenen Teil der Verbindungskarte direkt in ihrem eigenen Speicher erstellt, ohne auf den zentralen Computer zu warten.
- Die Analogie: Jetzt schreibt nicht mehr in der Küche die Liste, sondern jeder Raum hat sein eigenes Notizbuch. Sobald die Party beginnt, schreiben die Gäste in jedem Raum sofort auf, wen sie kennen. Es ist kein Hin- und Herlaufen zur Küche mehr nötig.
- Das Ergebnis: Dieser „onboard"-Aufbau ist mehr als 10-mal schneller als der alte Weg. In einem Test dauerte es 55 Sekunden, um das Netzwerk zu erstellen, statt fast 12 Minuten.
3. Zwei Arten, Nachrichten zu senden
Sobald die Karte erstellt ist, müssen die GPUs während der Simulation die „Textnachrichten" (Spikes) austauschen. Die Arbeit testete zwei verschiedene Strategien hierfür, je nachdem, wie das Netzwerk organisiert ist:
Strategie A: Der direkte Anruf (Punkt-zu-Punkt)
- Funktionsweise: Wenn ein Neuron in GPU #1 mit einem spezifischen Neuron in GPU #2 sprechen muss, ruft es diese spezifische GPU direkt an.
- Am besten geeignet für: Netzwerke, bei denen Verbindungen ungleichmäßig oder spezifisch sind (wie ein reales Gehirn, in dem sich manche Bereiche viel unterhalten, aber nicht mit allen).
- Die Behauptung der Arbeit: Sie verwendeten dies für ein Modell des visuellen Kortex eines Affen (32 verschiedene Bereiche). Es funktionierte perfekt und bewies, dass die neue Karten-Erstellungsmethode mit komplexen, realen Gehirnstrukturen kompatibel ist.
Strategie B: Der Gruppenchat (Kollektive Kommunikation)
- Funktionsweise: Anstatt einzelne Personen anzurufen, schreit eine GPU ihre Nachrichten an eine ganze Gruppe von GPUs gleichzeitig. Jeder in der Gruppe hört den Schrei und prüft, ob die Nachricht für ihn bestimmt ist.
- Am besten geeignet für: Riesige, zufällige Netzwerke, in denen jeder mit jedem spricht (wie eine ausgeglichene Menge).
- Die Behauptung der Arbeit: Sie testeten dies an einem massiven „ausgeglichenen Netzwerk", das auf bis zu 1.024 GPUs skalierte. Dies ist eine enorme Anzahl von Grafikkarten, die zusammenarbeiten. Sie zeigten, dass sich das System selbst mit so vielen Karten reibungslos hochskaliert, ohne abzustürzen.
4. Der Trick mit den „Speicherebenen"
GPUs haben viel Speicher, aber nicht unendlich viel. Die Speicherung der Verbindungskarten für Milliarden von Neuronen nimmt viel Platz in Anspruch.
- Die Analogie: Stellen Sie sich vor, Sie haben einen kleinen Schreibtisch (GPU-Speicher) und ein riesiges Lagerhaus (CPU-Speicher).
- Die Lösung: Die Autoren schufen vier „Ebenen" der Organisation.
- Ebene 0: Halten Sie die Karten im Lagerhaus (CPU) und bringen Sie nur das mit, was Sie auf den Schreibtisch benötigen. Dies spart Schreibtischplatz, ist aber langsamer beim Abrufen.
- Ebene 3: Füllen Sie den Schreibtisch mit allem. Dies ist am schnellsten, erfordert aber einen größeren Schreibtisch.
- Die Behauptung der Arbeit: Sie zeigten, dass sie durch die Wahl der richtigen Ebene Simulationen auf dem Leonardo Booster-Supercomputer (der 4.096 GPUs besitzt) durchführen konnten, und sagten sogar voraus, dass der kommende JUPITER-Supercomputer ein Netzwerk mit 230 Millionen Neuronen und 2,5 Billionen Synapsen simulieren könnte. Das entspricht ungefähr der Größe des menschlichen Kortex!
Zusammenfassung der erzielten Ergebnisse
- Geschwindigkeit: Sie machten die „Einrichtungs"-Phase von Gehirnsimulationen um das 10-fache schneller, indem sie die Netzwerkkarte direkt auf den Grafikkarten erstellten.
- Skalierbarkeit: Sie bewiesen, dass dies gleichzeitig auf bis zu 1.024 GPUs funktioniert.
- Flexibilität: Sie zeigten zwei verschiedene Möglichkeiten, die Kommunikation zu handhaben (direkte Anrufe vs. Gruppenchats), damit Wissenschaftler die beste Methode für ihr spezifisches Gehirnmodell wählen können.
- Zukunftssicherheit: Ihre Methoden sind so konzipiert, dass sie auf der nächsten Generation von „Exascale"-Supercomputern funktionieren, die stark genug sein werden, um ein komplettes menschliches Gehirn mit Details einzelner Synapsen zu simulieren.
Kurz gesagt: Sie haben nicht nur die Simulation schneller laufen lassen; sie bauten ein besseres „Straßensystem" für die Daten, damit der Supercomputer nicht schon vor dem Start des Rennens im Verkehr stecken bleibt.
Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?
Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.