Working Paper: Towards a Category-theoretic Comparative Framework for Artificial General Intelligence

Each language version is independently generated for its own context, not a direct translation.

Der Bauplan für den ultimativen Roboter: Ein neuer Weg, um KI zu verstehen

Stell dir vor, die Welt der Künstlichen Intelligenz (KI) ist wie eine riesige Baustelle. Es gibt unzählige verschiedene Roboter-Entwürfe: Manche lernen durch Belohnung (wie ein Hund, der Leckerlis bekommt), andere versuchen, die Welt kausal zu verstehen (wie ein Detektiv), und wieder andere nutzen komplexe Schemata (wie ein erfahrener Handwerker).

Das Problem ist: Bisher gab es keine gemeinsame Sprache, um diese verschiedenen Entwürfe zu vergleichen. Es ist, als würde ein Architekt, ein Tischler und ein Elektriker versuchen, über ein Haus zu sprechen, aber jeder nutzt eine völlig andere Sprache. Der eine spricht von "Fundamenten", der andere von "Holzverbindungen" und der dritte von "Stromkreisen". Niemand versteht genau, wo die Unterschiede liegen oder welche Vorteile der andere hat.

Dieses Papier von Pablo de los Riscos, Fernando Corbacho und Michael Arbib schlägt vor, Mathematik als universelle Übersetzer-Sprache zu nutzen. Genauer gesagt: Kategorientheorie. Klingt kompliziert? Machen wir es einfach.

1. Der Bauplan vs. das fertige Haus (Architektur vs. Agent)

Stell dir vor, du möchtest ein Haus bauen.

Die Architektur ist der Bauplan. Er sagt dir: "Hier ist eine Küche, hier ist ein Bad, und die Küche muss mit dem Bad verbunden sein." Der Plan sagt aber nicht, welche Farbe die Wände haben, ob die Fliesen aus Keramik oder Stein sind, oder welche Marke der Kühlschrank hat.
Der Agent (der Roboter) ist das fertige Haus. Es ist die konkrete Umsetzung des Plans mit echten Materialien.

Die Autoren sagen: "Hör auf, nur über die fertigen Häuser (die konkreten Algorithmen) zu reden. Wir müssen die Baupläne (die Architekturen) selbst vergleichen."

2. Die zwei Seiten einer Architektur: Das Gerüst und das Wissen

Jeder gute Bauplan hat zwei entscheidende Aspekte, die oft vermischt werden:

Das Gerüst (Syntax): Wie fließt die Arbeit?
- Beispiel: Ein Arzt. Der Ablauf ist immer gleich: Symptome ansehen → Diagnose stellen → Behandlung geben → Ergebnis prüfen. Das ist das Gerüst. Es ist egal, ob der Arzt ein junger Assistenzarzt oder ein erfahrener Professor ist; der Ablauf ist derselbe.
Das Wissen (Epistemik): Was passiert im Kopf?
- Beispiel: Der junge Arzt hat vielleicht nur ein starres Buch im Kopf. Wenn ein neues, seltsames Symptom auftaucht, passt er nur die Wahrscheinlichkeiten im Buch an (z.B. "Vielleicht ist es zu 60% Grippe"). Der erfahrene Professor hingegen erkennt: "Moment, das ist eine ganz neue Krankheit!" und erstellt einen neuen Eintrag im Buch.
- Der Unterschied: Beide haben den gleichen Ablauf (Gerüst), aber ihre Wissensstruktur ist völlig anders. Der eine kann sein Wissen nicht umbauen, der andere schon.

Die Autoren trennen diese beiden Dinge in ihrer Mathematik sauber voneinander, um zu sehen, wo genau ein KI-System "stolpert".

3. Die drei Beispiele: Von einfach zu komplex

Um zu zeigen, wie gut ihre neue Sprache funktioniert, vergleichen sie drei Arten von KI-Architekturen:

A. Der klassische Lerner (Reinforcement Learning - RL)

Analogie: Ein Hund, der Tricks lernt.
Wie es funktioniert: Er macht etwas, bekommt Belohnung oder Strafe, und passt eine einzige große "Gedanken-Liste" (Parameter) an.
Das Problem: Alles Wissen ist in einem einzigen, undurchsichtigen Haufen gespeichert. Wenn der Hund lernt, dass "Ball werfen" gut ist, vergisst er vielleicht, dass "Ball fangen" auch gut ist, weil alles in einem Haufen vermischt ist. Es gibt keine Struktur im Wissen.

B. Der Kausale Lerner (Causal RL)

Analogie: Ein Detektiv.
Wie es funktioniert: Der Detektiv hat nicht nur eine Liste, sondern zwei getrennte Notizbücher: eines für "Was tue ich?" (Politik) und eines für "Wie funktioniert die Welt?" (Kausales Modell).
Der Vorteil: Er kann experimentieren. "Wenn ich das Licht ausmache, wird es dunkel." Er versteht Ursache und Wirkung. Aber: Die Notizbücher sind immer noch riesige, ungeteilte Blöcke. Er kann nicht einfach eine Seite herausreißen und in einem anderen Fall wiederverwenden.

C. Der Schemata-Lerner (Schema-Based Learning - SBL)

Analogie: Ein erfahrener Handwerker mit einer Werkzeugkiste.
Wie es funktioniert: Statt eines riesigen Haufens Wissen hat er viele kleine, spezialisierte Werkzeuge (Schemata).
- Ein Werkzeug für "Türen öffnen".
- Ein Werkzeug für "Schrauben festziehen".
- Ein Werkzeug für "Wasser leiten".
Der Vorteil: Wenn er ein neues Problem hat, nimmt er die passenden Werkzeuge, baut sie zusammen (Komposition) und passt sie an. Er vergisst nichts, weil jedes Werkzeug separat ist. Er kann alte Lösungen in neuen Situationen wiederverwenden. Das ist der Schlüssel zu echter "Allgemeiner Intelligenz" (AGI).

4. Warum ist das wichtig? (Die "Kategorientheorie")

Die Autoren nutzen die Kategorientheorie nicht, um die Mathematik komplizierter zu machen, sondern um Verbindungen sichtbar zu machen.

Stell dir vor, die Kategorientheorie ist wie ein Super-Übersetzer, der alle diese Baupläne (RL, Kausal, Schemata) in ein einziges, gemeinsames Diagramm übersetzt.

Er kann zeigen: "Schau mal, der Kausale Lerner ist eigentlich nur eine spezielle Version des Schemata-Lerners, bei dem man die Werkzeuge noch nicht trennen darf."
Er kann zeigen: "Wenn wir die Architektur so ändern (z.B. mehr Werkzeuge hinzufügen), gewinnen wir automatisch die Fähigkeit, Dinge zu lernen, die der einfache Hund nie lernen kann."

5. Das große Ziel

Das Papier ist ein "Arbeitsentwurf" (Working Paper). Es ist der erste Schritt zu einem riesigen Projekt.
Die Vision ist:

Vergleichen: Wir können endlich genau sagen, warum Architektur A besser für Aufgabe X ist als Architektur B.
Vorhersagen: Wir können mathematisch beweisen, welche Fähigkeiten eine Architektur notwendigerweise hat und welche ihr fehlen.
Bauen: Wir können neue, bessere KI-Architekturen entwerfen, indem wir die besten Teile der alten Pläne mathematisch korrekt zusammenfügen.

Zusammenfassend:
Die Autoren sagen: "Hört auf, nur über die einzelnen Roboter zu reden. Lasst uns über die Baupläne sprechen. Mit unserer neuen mathematischen Sprache (Kategorientheorie) können wir diese Pläne vergleichen, verstehen, warum manche klüger sind als andere, und endlich die Baupläne für den ultimativen, universell lernfähigen Roboter (AGI) zeichnen."

Es ist der Versuch, aus dem Chaos der KI-Forschung eine klare, strukturierte Landkarte zu machen.

Working Paper: Towards a Category-theoretic Comparative Framework for Artificial General Intelligence

Der Bauplan für den ultimativen Roboter: Ein neuer Weg, um KI zu verstehen

1. Der Bauplan vs. das fertige Haus (Architektur vs. Agent)

2. Die zwei Seiten einer Architektur: Das Gerüst und das Wissen

3. Die drei Beispiele: Von einfach zu komplex

4. Warum ist das wichtig? (Die "Kategorientheorie")

5. Das große Ziel

Mehr davon

ChartDiff: A Large-Scale Benchmark for Comprehending Pairs of Charts

Towards Computational Social Dynamics of Semi-Autonomous AI Agents

Enhancing Policy Learning with World-Action Model

Mimosa Framework: Toward Evolving Multi-Agent Systems for Scientific Research

Drop the Hierarchy and Roles: How Self-Organizing LLM Agents Outperform Designed Structures