Symbol-Equivariant Recurrent Reasoning Models

Die Autoren stellen Symbol-äquivariante rekurrente Reasoning-Modelle (SE-RRMs) vor, die durch architektonisch erzwungene Permutationsäquivarianz nicht nur die Robustheit und Skalierbarkeit bei Aufgaben wie Sudoku und ARC-AGI verbessern, sondern auch eine Generalisierung auf nicht im Training gesehene Instanzgrößen ermöglichen.

Richard Freinschlag, Timo Bertram, Erich Kobler, Andreas Mayr, Günter Klambauer

Veröffentlicht 2026-03-03
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Das große Rätsel: Warum KI bei Logikspielen oft scheitert

Stell dir vor, du hast einen sehr schlauen Roboter, der riesige Datenmengen lesen kann (wie ein riesiges Buch, das alle Wörter der Welt enthält). Wenn du ihn bittest, einen Satz zu schreiben, ist er genial. Aber wenn du ihn bittest, ein Sudoku zu lösen oder einen Labyrinth-Pfad zu finden, stolpert er oft. Warum?

Das Problem ist, dass diese Roboter (neuronale Netze) oft wie Kinder sind, die Dinge auswendig lernen, statt die Regeln zu verstehen.

  • Wenn sie ein Sudoku mit den Zahlen 1 bis 9 lernen, merken sie sich oft nur, dass „die rote 3 an dieser Stelle steht".
  • Wenn du ihnen dann ein Sudoku mit den Farben Rot, Blau und Grün gibst, sind sie verwirrt. Sie denken: „Ich habe das noch nie gesehen!"

Frühere KI-Modelle (die sogenannten RRMs) haben versucht, dieses Problem zu lösen, indem sie dem Roboter tausende von Beispielen zeigten, bei denen die Zahlen oder Farben einfach durcheinander gewürfelt wurden (Data Augmentation). Das ist, als würdest du einem Kind 1000 verschiedene Sudoku-Bücher geben, nur damit es lernt, dass die Zahl 5 auch eine 5 bleibt, egal ob sie rot oder blau gedruckt ist. Das kostet aber viel Zeit und Rechenleistung.

Die neue Lösung: SE-RRM – Der „Regel-Versteher"

Die Forscher aus Österreich haben eine neue Architektur entwickelt, die SE-RRM heißt. Stell dir das wie einen neuen Typ von Gehirn für den Roboter vor.

Statt dem Roboter tausende Beispiele zu zeigen, bauen sie ihm eine intelligente Brille auf, die ihm sofort sagt: „Hey, die Farbe Rot ist hier genau so wichtig wie die Farbe Blau. Wenn du die Farben tauschst, ändert sich die Lösung nicht, nur die Farben."

Das nennt man Symbol-Äquivarianz (ein kompliziertes Wort für: „Symmetrie verstehen").

Die Analogie: Der Schachspieler vs. der Maler

  1. Der alte Ansatz (RRM): Stell dir einen Maler vor, der lernt, Schach zu spielen. Er malt auf ein Brett, wo die Figuren stehen. Wenn er das Brett dreht oder die Figuren umbenennt (z. B. statt „Turm" sagt er „Kasten"), muss er das Brett neu malen und von vorne lernen. Er versteht nicht, dass die Regeln des Spiels gleich bleiben.
  2. Der neue Ansatz (SE-RRM): Dieser Roboter ist wie ein Schachgroßmeister. Er weiß: „Es ist egal, ob ich den Turm aus Holz oder aus Plastik mache. Die Regeln, wie er sich bewegt, sind identisch." Er kann also sofort ein Spiel mit neuen Figuren (z. B. aus Minecraft) spielen, ohne vorher geübt zu haben.

Was macht SE-RRM besonders?

1. Es versteht die „Sprache" der Symbole
In einem Sudoku sind die Zahlen 1, 2, 3... nur Platzhalter. Du könntest sie durch Äpfel, Birnen und Bananen ersetzen, und das Rätsel wäre immer noch dasselbe.

  • Alte Modelle: Lernen, dass „Apfel" an Position A steht. Wenn du „Banane" an Position A setzt, geraten sie in Panik.
  • SE-RRM: Lernt die Beziehung zwischen den Positionen. Es sagt: „Egal, was für ein Symbol hier ist, es darf nicht mit dem Symbol daneben identisch sein."

2. Es wächst mit dem Problem mit (Skalierbarkeit)
Das ist der coolste Teil.

  • Wenn du ein 4x4 Sudoku (klein) trainierst und dann ein 25x25 Sudoku (riesig) bekommst, scheitern alte Modelle. Sie wissen nicht, wie sie mit den neuen, vielen Symbolen umgehen sollen.
  • SE-RRM kann das! Weil es die Regel verstanden hat („Alle Symbole in einer Reihe müssen unterschiedlich sein"), kann es sofort ein riesiges Sudoku lösen, auch wenn es so etwas noch nie gesehen hat. Es ist wie ein Kind, das das Einmaleins lernt und dann plötzlich große Zahlen multiplizieren kann, ohne es extra geübt zu haben.

3. Es braucht weniger „Futter"
Da das Modell die Symmetrie von Haus aus versteht, muss es nicht mit tausenden von künstlich erzeugten Beispielen gefüttert werden.

  • Vergleich: Ein alter Roboter braucht 1000 verschiedene Bilder, um zu verstehen, dass ein Hund auch ein Hund ist, wenn er auf dem Kopf steht. Der SE-RRM-Roboter braucht vielleicht nur 8 Bilder, weil er die Logik dahinter sofort erfasst.

Die Ergebnisse im echten Leben

Die Forscher haben ihre neue KI an drei großen Herausforderungen getestet:

  1. Sudoku:
    • Sie haben das Modell nur auf normalen 9x9 Sudokus trainiert.
    • Ergebnis: Es löste fast perfekt kleine 4x4 Sudokus (die es nie gesehen hatte) und schaffte es sogar, bei riesigen 16x16 und 25x25 Sudokus viel besser zu sein als alle anderen KIs, die einfach raten mussten.
  2. ARC-AGI (Logik-Rätsel):
    • Hier muss die KI Muster erkennen (z. B. „Wenn ich diesen Block hier hinlege, passiert das").
    • Ergebnis: SE-RRM war genauso gut wie die besten bisherigen Modelle, brauchte aber viel weniger Trainingsdaten und war viel kleiner (nur 2 Millionen Parameter, während andere 27 Millionen hatten).
  3. Labyrinthe:
    • Hier sind Symbole nicht austauschbar (eine Wand ist keine Wand, wenn sie ein Startpunkt ist).
    • Ergebnis: Auch hier war die neue Architektur stark, zeigte aber, dass man die „Symmetrie-Brille" abnehmen kann, wenn sie nicht passt.

Fazit: Warum ist das wichtig?

Stell dir vor, du willst einen Roboter bauen, der dir hilft, komplexe Pläne zu erstellen, Diagnosen zu stellen oder Gesetze zu verstehen. Diese Probleme sind oft voller Regeln und Symbole.

Bisher mussten wir diese Roboter mit riesigen Datenmengen „füttern", damit sie lernen, dass A gleich B ist, wenn man sie vertauscht.
SE-RRM ist wie ein Roboter, der von Geburt an die Logik der Symmetrie versteht. Er ist:

  • Effizienter: Er braucht weniger Daten.
  • Robuster: Er macht weniger Fehler, wenn sich die Farben oder Bezeichnungen ändern.
  • Skalierbar: Er kann Probleme lösen, die größer sind als alles, was er je gesehen hat.

Kurz gesagt: Die Forscher haben der KI beigebracht, nicht nur auswendig zu lernen, sondern die tieferen Regeln der Welt zu verstehen. Das ist ein großer Schritt hin zu echter „künstlicher Intelligenz" und nicht nur zu einem sehr gut trainierten „Affen, der Tasten drückt".

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →