Versor: A Geometric Sequence Architecture

Die Arbeit stellt Versor vor, eine neuartige Sequenzarchitektur, die statt linearer Operationen konforme geometrische Algebra nutzt, um durch native Darstellung von $SE(3)$-Äquivarianz, eine drastische Reduktion der Parameterzahl, verbesserte Interpretierbarkeit und überlegene Generalisierungsfähigkeit bei gleichzeitig höherer Effizienz Transformer und andere Baseline-Modelle in verschiedenen Aufgaben zu übertreffen.

Truong Minh Huy, Edward Hirst

Veröffentlicht 2026-02-27
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

🌟 Versor: Der neue Architekt für künstliche Intelligenz

Stell dir vor, du möchtest einem Computer beibringen, wie die Welt funktioniert. Bisher haben wir ihm das mit einer sehr starren Methode beigebracht: Wir haben ihm gesagt, dass alles nur eine Liste von Zahlen ist (wie eine Tabelle in Excel). Das nennt man "Vektorraum".

Das Problem dabei ist: Die echte Welt ist keine Excel-Tabelle. Die Welt besteht aus Bewegungen, Rotationen, Entfernungen und Perspektiven. Wenn du einen Ball wirfst, dreht er sich, fliegt durch die Luft und wird langsamer. Ein herkömmlicher KI-Modell (wie ein Transformer) muss das alles erst aus Millionen von Beispielen lernen, als würde ein Kind versuchen, das Fliegen zu verstehen, indem es nur Fotos von fliegenden Vögeln betrachtet, ohne die Gesetze der Physik zu kennen. Das ist ineffizient und oft ungenau, wenn sich die Bedingungen ändern.

Versor ist eine neue Art von KI-Architektur, die diesen Fehler behebt. Sie sagt: "Warum sollen wir die Physik erst lernen, wenn wir sie einfach in die Grundbausteine des Modells einbauen können?"

Hier ist die Idee, vereinfacht erklärt:

1. Der "Flache Raum" vs. Der "Krumme Raum" (Das Problem)

Stell dir vor, du zeichnest eine Landkarte.

  • Der alte Weg (Transformer): Du zeichnest alles auf ein flaches Blatt Papier. Wenn du eine Kugel (die Erde) auf dieses Papier projizierst, verzerrt sich alles. Um zu verstehen, wie weit zwei Punkte wirklich voneinander entfernt sind, muss der Computer mühsam rechnen und sich merken, wo die Verzerrung ist.
  • Der Versor-Weg: Versor benutzt eine Art "magische Landkarte" (konforme geometrische Algebra), auf der Entfernungen und Winkel immer korrekt sind, egal wie du die Karte drehst oder zoomst. Es ist, als würdest du nicht auf Papier malen, sondern direkt auf einer Kugel.

2. Die "Versor"-Maschine: Wie sie funktioniert

Versor nutzt eine spezielle mathemische Sprache namens Clifford-Algebra (genauer: Cl4,1Cl_{4,1}). Das klingt kompliziert, aber stell es dir so vor:

  • Normale KI: Sie denkt in Punkten. "Der Ball ist hier (x, y, z)."
  • Versor: Sie denkt in Bewegungen. Sie denkt nicht nur in Punkten, sondern in Rotoren. Ein Rotor ist wie ein unsichtbarer Arm, der einen Punkt greift und ihn dreht oder verschiebt.

Die Analogie des Tanzes:
Stell dir vor, du hast einen Tanzpartner.

  • Ein herkömmliches Modell versucht, jede einzelne Pose des Partners zu memorieren. Wenn der Partner einen Schritt zur Seite macht, muss das Modell neu lernen, wie die neue Pose aussieht.
  • Versor versteht die Schritte. Es weiß: "Wenn ich diesen Rotor (diesen Schritt) anwende, bewegt sich der Partner genau so." Es muss nicht jede Pose auswendig lernen, es kennt die Regeln der Bewegung.

3. Die zwei Superkräfte von Versor

A. Die "Verstehende Aufmerksamkeit" (Geometric Product Attention)
Wenn eine normale KI (Transformer) auf ein Bild schaut, fragt sie: "Wie ähnlich ist Pixel A Pixel B?" (Nur Distanz).
Versor fragt: "Wie ähnlich sind sie, und in welche Richtung zeigen sie zueinander?"

  • Beispiel: Stell dir vor, du hast zwei Autos. Ein normales Modell sieht nur, wie nah sie beieinander sind. Versor sieht auch, ob sie aufeinander zufahren oder aneinander vorbeifahren. Es zerlegt die Beziehung in zwei Teile:
    1. Nähe: Wie nah sind sie? (Skalar)
    2. Drehmoment/Orientierung: Wie drehen sie sich zueinander? (Bivektor)
      Das macht die KI viel schlauer bei physikalischen Aufgaben, wie z.B. dem Vorhersagen von Planetenbahnen.

B. Der "Unendliche Speicher" (Recursive Rotor Accumulator)
Normale KIs haben oft ein Problem mit langen Geschichten. Je länger die Geschichte, desto mehr "vergisst" sie oder wird verwirrt (wie ein Mensch, der versucht, sich an 10.000 Wörter zu erinnern).
Versor nutzt einen Trick: Es speichert die Geschichte nicht als Liste von Wörtern, sondern als eine einzige, fortlaufende Drehung.

  • Analogie: Stell dir vor, du läufst durch einen Wald. Ein normaler KI-Speicher macht bei jedem Schritt ein Foto und stapelt sie. Versor merkt sich nur: "Ich habe mich insgesamt 45 Grad nach links gedreht." Egal, wie lange du läufst, dieser eine Gedanke bleibt stabil. Das spart enorm viel Speicherplatz und Rechenleistung.

4. Warum ist das so wichtig? (Die Ergebnisse)

Das Papier zeigt, dass Versor in vielen Bereichen besser ist als die aktuellen Spitzenmodelle:

  • Sparsamkeit: Versor erreicht bessere Ergebnisse mit 200-mal weniger Parametern (Gedächtnis) als ein normaler Transformer. Es ist wie ein Genie, das mit einem Taschenrechner rechnet, während der Transformer einen Supercomputer braucht.
  • Generalisierung: Wenn man Versor an einem kleinen System trainiert (z.B. 5 Planeten), versteht es sofort, wie ein System mit 100 Planeten funktioniert. Ein normaler Transformer scheitert daran komplett, weil es nur die Zahlen auswendig gelernt hat, nicht das Prinzip.
  • Robustheit: Wenn man die Masse der Planeten plötzlich verdoppelt (etwas, das es im Training nicht gab), passt sich Versor sofort an. Normale KIs stürzen hier oft katastrophal ab.
  • Geschwindigkeit: Durch spezielle Hardware-Optimierungen (Bit-Masken) ist Versor auf modernen Chips sogar schneller als die großen Modelle, obwohl es komplexere Mathematik macht.

5. Wo wird es eingesetzt?

Versor ist nicht nur für Physik gedacht. Es funktioniert überall, wo Struktur und Beziehung wichtig sind:

  • Robotik: Damit Roboterarme sich nicht "verdrillen" und immer genau wissen, wo sie sind.
  • Medizin: Um die Faltung von Proteinen zu verstehen (wie ein 3D-Puzzle).
  • Alltag: Sogar bei der Erkennung von Bildern oder Texten, wo es hilft, Zusammenhänge besser zu verstehen, ohne riesige Datenmengen zu brauchen.

Fazit

Versor ist wie der Wechsel von einem Computer, der nur Zahlen addiert, zu einem Computer, der die Gesetze der Geometrie versteht. Es ist effizienter, stabiler und intelligenter, weil es die Welt so behandelt, wie sie wirklich ist: nicht als flache Liste von Zahlen, sondern als ein dynamisches, sich bewegendes Ganzes.

Es ist ein Schritt hin zu KI, die nicht nur "lernt", sondern "begreift".

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →