Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen
Stellen Sie sich ein massives, digitales Kassenbuch vor (wie ein riesiges öffentliches Notizbuch), das jede Transaktion in einem Blockchain-Netzwerk aufzeichnet. Um dieses Notizbuch sicher und ehrlich zu halten, müssen alle zustimmen, was darin geschrieben steht. Dieser Abstimmungsprozess wird als „Konsens“ bezeichnet.
Lange Zeit war die beliebteste Art und Weise, dies zu tun, Proof-of-Work. Denken Sie an dies wie eine weltweite Lotterie, bei der Millionen von Menschen verzweifelt versuchen, ein mathematisches Rätsel zu lösen. Wer das Rätsel zuerst löst, gewinnt. Das Problem? Es verbraucht eine enorme Menge an Elektrizität, etwa so viel, wie ein kleines Land in einem Jahr verbraucht.
Um dies zu beheben, wurde eine neuere Methode namens Proof-of-Space erfunden. Anstatt Rätsel immer und immer wieder zu lösen, bereitet die Mine (Miner) eine riesige „Karte“ (genannt Plot) im Voraus vor und speichert sie auf ihren Festplatten. Wenn das Netzwerk eine Frage stellt, schaut der Miner einfach die Antwort auf seiner Karte nach. Dies verbraucht viel weniger Energie.
Das Problem:
Das Erstellen dieser riesigen Karten ist langsam. Es ist, als würde man versuchen, eine Bibliothek mit Büchern zu füllen, aber der Bibliothekar (der Computer-CPU) schreibt jedes einzelne Buch von Hand, Wort für Wort. Selbst wenn man einen sehr schnellen, teuren Bibliothekar hat, dauert es zu lange, um die Bibliothek bereit zu machen.
Die Lösung: VaultxGPU
Die Autoren dieser Arbeit haben ein neues Werkzeug namens VaultxGPU entwickelt. Anstatt einen langsamen Bibliothekar zu benutzen, haben sie ein Team aus superschnellen Robotern (der GPU, oder Grafikkarte) engagiert, um die schwere Arbeit zu erleden.
Hier ist die Erklärung, wie sie es gemacht haben, unter Verwendung einfacher Analogien:
1. Die Strategie „Ein Roboter pro Buch“
Bei der alten Methode versuchte die CPU, Bücher nacheinander oder in kleinen Gruppen zu schreiben. VaultxGPU weist jedem einzelnen Roboter eine Seite des Buches gleichzeitig zu.
- Die Analogie: Stellen Sie sich vor, Sie müssen 10.000 Umschläge mit Briefen füllen. Die CPU könnte eine Person haben, die es erledigt, oder vielleicht ein paar Leute, die sich die Arbeit teilen. VaultxGPU engagiert 10.000 Roboter, und jeder Roboter greift sich sofort einen Umschlag und füllt ihn, ohne jemals mit den anderen zu kommunizieren. Dies ist der Blake3-Hashing-Teil, der die eigentliche mathematische Arbeit darstellt.
2. Der „Verkehrsstau-freie“ Speicher
Normalerweise müssen Computer, wenn sie schwere Arbeit verrichten, ständig Daten zwischen dem Hauptspeicher und dem Prozessor hin- und herbewegen, wie ein Lieferwagen, der im Stau steht.
- Die Analogie: VaultxGPU hält alle notwendigen Daten direkt innerhalb des Arbeitsbereichs des Roboters (dem VRAM der GPU). Sie müssen die Daten nicht auf die Straße fahren und wieder zurückbringen. Sie halten alles in der „Küche“, sodass die Köche (Roboter) niemals ihren Platz verlassen müssen. Dies vermeidet die „Verkehrsstaus“, die andere Computer verlangsamen.
3. Die „fusionierte“ Küche
Der Prozess besteht aus zwei Hauptschritten: das Sortieren der Briefe und das Zusammenpassen der Paare. Normalerweise sortiert man die Briefe, legt sie in eine Box, fährt die Box in einen neuen Raum und passt sie dann zusammen.
- Die Analogie: VaultxGPU kombiniert diese Schritte. Sie sortieren die Briefe und passen sie im selben Raum zusammen, ohne die Box jemals bewegen zu müssen. Sie haben eine spezielle „fusionierte“ Küche gebaut, in der das Sortieren und das Zusammenpassen gleichzeitig stattfinden, was eine massive Menge an Zeit spart.
4. Verschiedene Sprachen sprechen
Das Paper erwähnt, dass sie dies für zwei verschiedene Arten von Roboter-Teams gebaut haben: NVIDIA (das eine Sprache namens CUDA verwendet) und AMD/Intel (das eine Sprache namens SYCL verwendet).
- Die Analogie: Es ist, als würde man ein Rezept schreiben, das perfekt funktioniert, egal ob Ihre Küche Gasherde (NVIDIA) oder Elektroherde (AMD/Intel) nutzt. Sie haben sichergestellt, dass die Kernanweisungen dieselben sind, aber sie haben die spezifischen Werkzeuge für jeden Herdentyp angepasst, damit jeder das gleiche köstliche Essen kochen kann.
Die Ergebnisse: Wie schnell ist es?
Das Team hat dies an einer Standard-Computeraufgabe getestet (Erstellung einer Karte für eine bestimmte Größe namens „K=31“).
- Der alte Weg (Einzel-CPU): Es dauerte 44 Minuten und 48 Sekunden (2.688 Sekunden).
- Der neue Weg (GPU):
- Die AMD/Intel-Version erledigte es in 45,4 Sekunden.
- Die NVIDIA-Version erledigte es in 53,8 Sekunden.
- Der Vergleich: Selbst wenn Sie einen Supercomputer mit 384 leistungsstarken CPU-Kernen verwendet hätten (der über 10.000 $ kostet), hätte er immer noch etwa 52 Sekunden gebraucht. Die GPU-Version war schneller oder fast genauso schnell, aber für einen viel niedrigeren Preis (etwa 5.000 $ für die Maschine).
Was ist immer noch schwierig?
Das Paper gibt zwei Dinge zu, die immer noch bremsen:
- Der „Schreib“-Engpass: Obwohl die Roboter sehr schnell darin sind, die Karte zu erstellen, wird das Schreiben der fertigen Karte auf die Festplatte immer noch vom langsamen Menschen (der CPU) erledigt. Es ist, als hätten Sie ein Team von 10.000 Druckern, die ein Buch in einer Sekunde drucken können, aber Sie haben nur eine einzige Person, die das Buch ins Regal tragen kann. Dieser Schritt nimmt mehr als die Hälfte der gesamten Zeit in Anspruch.
- Der „Sortier“-Fehler: Wenn die Karten größer werden, wird der Teil, in dem die Daten sortiert werden, langsamer, da sie eine einfache „Eins-nach-dem-anderen“-Sortierungsmethode verwenden. Es ist, als würde man versuchen, eine riesige Menge zu organisieren, indem man eine Person fragt, die nacheinander jeden Namen prüft; das funktioniert bei einer kleinen Gruppe gut, wird aber bei einer riesigen Menge chaotisch.
Fazsetzung
Das Paper kommt zu dem Schluss, dass die Verwendung von GPUs (Grafikkarten) der richtige Weg ist, um diese Blockchain-Karten zu erstellen. Es ist viel schneller und günstiger als die Verwendung von nur CPUs. Auch wenn es noch einige Geschwindigkeitsbarrieren gibt (wie die Schreibgeschwindigkeit der Festplatte), ist der „Roboterteam“-Ansatz eindeutig die Zukunft für die Skalierung dieser Technologie.
Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?
Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.