VMXDOTP: A RISC-V Vector ISA Extension for Efficient Microscaling (MX) Format Acceleration

Die Arbeit stellt VMXDOTP vor, eine RISC-V-Vector-ISA-Erweiterung, die durch die Einführung einer spezialisierten Instruktion für effiziente Mikroscaling-Format-Berechnungen (MX) die Auslastung und Energieeffizienz von VPE-Clustern bei Transformer-Modellen signifikant steigert.

Max Wipfli, Gamze İslamoğlu, Navaneeth Kunhi Purayil, Angelo Garofalo, Luca Benini

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der Forschungspapiers „VMXDOTP", verpackt in eine Geschichte mit alltäglichen Vergleichen.

Das Problem: Der riesige Umzugswagen

Stellen Sie sich vor, moderne Künstliche Intelligenz (KI) ist wie ein riesiger Umzug. In der Vergangenheit waren die Möbel (die Daten) alle gleich groß und schwer – wie Standard-Kartons. Das war einfach zu organisieren.

Heute aber haben wir es mit Transformern (den modernen KI-Modellen) zu tun. Diese haben nicht nur große Kartons, sondern auch unzählige kleine, zerbrechliche Scherben und riesige, flache Teppiche. Das Problem: Um diese KI-Modelle auf einem Computer laufen zu lassen, brauchen wir so viel Speicherplatz und Bandbreite (die Straße, auf der die Möbel fahren), dass die Umzugswagen (die Prozessoren) fast platzen.

Um das zu lösen, haben die Erfinder eine neue Art von Verpackung erfunden: MX-Formate (Microscaling).

  • Die Idee: Statt jeden einzelnen kleinen Gegenstand (Datenpunkt) in einem eigenen, schweren Karton zu verpacken, packt man 32 kleine Gegenstände in einen einzigen, leichten Beutel. Dazu gibt es nur ein einziges Etikett (den Skalierungsfaktor), das für alle 32 Gegenstände im Beutel gilt.
  • Der Vorteil: Der Umzugswagen wird viel leichter, und man braucht weniger Treibstoff (Energie).
  • Das Problem: Die alten Umzugsunternehmen (die aktuellen Computer-Prozessoren) sind darauf trainiert, nur einzelne Kartons zu bewegen. Wenn sie diese neuen Beutel mit 32 Gegenständen bekommen, müssen sie erst den Beutel öffnen, jeden Gegenstand einzeln herausnehmen, in einen neuen, schweren Karton packen und dann erst verarbeiten. Das kostet mehr Zeit und Energie, als wenn man die Gegenstände einfach so gelassen hätte. Die Effizienz geht verloren.

Die Lösung: Ein neuer Werkzeugkasten (VMXDOTP)

Die Autoren dieses Papiers haben gesagt: „Halt! Wir müssen den Umzugswagen nicht nur anpassen, wir brauchen ein neues Werkzeug, das direkt mit diesen Beuteln umgehen kann."

Sie haben eine Erweiterung für die RISC-V-Prozessoren (eine Art offener, flexibler Werkzeugkasten für Computer) entwickelt, die VMXDOTP heißt.

Hier ist, wie es funktioniert, mit einer Analogie:

1. Der alte Weg (Software-Emulation)

Stellen Sie sich einen sehr fleißigen, aber langsamen Handwerker vor. Er bekommt einen Beutel mit 32 Nägeln.

  1. Er nimmt den Beutel.
  2. Er liest das Etikett (Skalierung).
  3. Er nimmt Nagel für Nagel heraus.
  4. Er schneidet jeden Nagel auf die richtige Größe zu (Umwandlung).
  5. Er rechnet mit jedem Nagel einzeln.
  6. Er packt das Ergebnis wieder ein.
    Das ist extrem viel Arbeit für den Handwerker. Er verbringt 80 % seiner Zeit mit dem Packen und Entpacken und nur 20 % mit der eigentlichen Arbeit.

2. Der neue Weg (VMXDOTP)

Jetzt bauen wir dem Handwerker eine spezielle Maschine direkt in die Werkstatt ein.

  • Diese Maschine kann den ganzen Beutel (die 32 Nägel) auf einmal greifen.
  • Sie liest das Etikett und passt die Nägel sofort an.
  • Sie rechnet mit allen 32 Nägeln gleichzeitig.
  • Sie spuckt das fertige Ergebnis aus.
    Der Handwerker muss nichts mehr entpacken. Die Maschine erledigt alles in einem einzigen, perfekten Schritt.

Was bringt das konkret?

Die Forscher haben diese neue Maschine in einen echten Chip (einen „VPE-Cluster" namens Spatz) eingebaut und getestet. Die Ergebnisse sind beeindruckend:

  • Geschwindigkeit: Die neue Maschine ist bis zu 7-mal schneller als der alte Handwerker, der alles per Hand (Software) macht.
  • Energie: Sie verbraucht viel weniger Strom. Man könnte sagen, sie fährt mit dem gleichen Treibstoff viel weiter.
  • Flexibilität: Früher waren die Beutel immer genau 32 Gegenstände groß. Mit VMXDOTP kann der Software-Entwickler sagen: „Machen wir die Beutel heute 16 oder 64 Gegenstände groß." Die Maschine passt sich automatisch an. Das ist wie ein Werkzeug, das sich von selbst an die Größe des Werkstücks anpasst.

Warum ist das wichtig?

Aktuell nutzen nur sehr große Firmen (wie NVIDIA oder AMD) spezielle, teure Chips, die so etwas können. Aber diese neue Erfindung (VMXDOTP) ist ein offener Standard. Das bedeutet:

  • Jeder kann diese Technologie nutzen.
  • Sie passt in die modernen, flexiblen RISC-V-Prozessoren, die immer häufiger in Smartphones, Robotern und kleinen Computern zu finden sind.
  • Sie macht KI auf kleinen Geräten viel schneller und sparsamer.

Zusammenfassung in einem Satz

Die Forscher haben einen neuen „Super-Befehl" für Computer entwickelt, der es erlaubt, KI-Daten in ihrer kompaktesten Form direkt zu verarbeiten, ohne sie erst mühsam umzuverpacken – wie ein Umzugswagen, der plötzlich Beutel mit 32 Gegenständen auf einmal heben kann, statt jeden einzeln zu tragen. Das macht KI schneller, günstiger und energieeffizienter.