CTM-AI: A Blueprint for General AI Inspired by a… — Allgemeinverständliche Erklärung

Ursprüngliche Autoren: Haofei Yu, Yining Zhao, Lenore Blum, Manuel Blum, Paul Pu Liang

Veröffentlicht 2026-05-07

📖 6 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Haofei Yu, Yining Zhao, Lenore Blum, Manuel Blum, Paul Pu Liang

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ⚕️ Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Die große Idee: Ein „bewusstes" Team von Experten

Stellen Sie sich vor, Sie versuchen, ein sehr kniffliges Rätsel zu lösen. Im Raum befindet sich ein Team von Experten: ein bildender Künstler, ein Musiker, ein Logiker, ein Historiker und ein Komiker.

Bei den meisten aktuellen KI-Systemen gibt es normalerweise einen „Chef" (einen zentralen Manager), der allen sagt, was zu tun ist, oder eine einzelne superkluge Person, die versucht, alles allein zu erledigen.

CTM-AI macht etwas anderes. Es ist inspiriert von einer Theorie darüber, wie menschliches Bewusstsein funktioniert (genannt Conscious Turing Machine). Anstelle eines Chefs verwendet es ein System, bei dem:

Alle gleichzeitig arbeiten.
Es keinen zentralen Chef gibt.
Sie darum konkurrieren, gehört zu werden.
Sie teilen, was sie lernen, um gemeinsam schlauer zu werden.

Das Papier behauptet, dass dieser Ansatz eine flexiblere, „allgemeine" KI schafft, die komplexe Aufgaben besser bewältigen kann als aktuelle Systeme.

Wie es funktioniert: Die „Town Hall"-Analogie

Stellen Sie sich das CTM-AI-System als eine geschäftige Town-Hall-Sitzung vor, bei der ein Problem (die Frage eines Benutzers) angekündigt wird. Hier ist der schrittweise Prozess, den das Papier beschreibt:

1. Die „unbewusste" Menge (Die Prozessoren)

Stellen Sie sich einen Raum voller Hunderte von Spezialisten vor (genannt LTM-Prozessoren). Einige sind gut darin, Bilder zu sehen, andere Töne zu hören, wieder andere Werkzeuge wie Taschenrechner oder Webbrowser zu nutzen, und einige sind einfach „freie Agenten", die bereit sind, neue Fähigkeiten zu erlernen.

Was sie tun: Wenn eine Frage hereinkommt, denkt jeder im Raum gleichzeitig darüber nach, basierend auf seiner eigenen Spezialisierung.
Die Ausgabe: Jeder schreibt eine kurze Notiz (einen „Chunk") auf, die Folgendes enthält:
- Die Kernaussage: Ihre beste Vermutung oder Feststellung.
- Der Score: Wie sicher sie sind.
- Die Frage: Eine Folgefrage, die sie jemand anderem stellen möchten, um das Rätsel zu lösen.

2. Der „Up-Tree"-Wettbewerb (Wer darf sprechen?)

Der Raum ist zu laut, als dass alle gleichzeitig sprechen könnten. Also verwenden sie ein Abstimmungssystem (den Up-Tree).

Die Notizen werden eine Leiter von Richtern hinaufgereicht.
Die Richter vergleichen die Notizen und Scores.
Der Gewinner: Nur die beste einzelne Notiz (die mit dem höchsten Vertrauen und der höchsten Relevanz) gewinnt das Recht, laut vorgelesen zu werden. Dies wird zum „bewussten" Gedanken des Systems.

3. Die „Down-Tree"-Ausstrahlung (Die Ankündigung)

Sobald der Gewinner gewählt ist, wird seine Notiz an alle im Raum ausgestrahlt (den Down-Tree).

Jetzt weiß jeder Spezialist, was der „bewusste" Gedanke ist.
Dies aktualisiert ihr Gedächtnis. Sie teilen nun alle denselben Kontext.

4. Die „Link"-Bildung (Das Flüsternetzwerk)

Dies ist der magische Teil. Wenn Spezialist A erkennt, dass Spezialist B Informationen hat, die helfen, die gewinnende Notiz zu erklären, bilden sie einen Link.

Unbewusste Kommunikation: Statt wieder über den Lautsprecher zu gehen, sprechen sie direkt miteinander.
Fusion: Sie kombinieren ihr Wissen. Wenn zum Beispiel der „Visuelle" Spezialist ein trauriges Gesicht sieht und der „Audio"-Spezialist einen fröhlichen Ton hört, verknüpfen sie sich, um zu erkennen, dass die Person sarkastisch ist.
Dies geschieht „unbewusst" (im Hintergrund), um ein reichhaltigeres Verständnis aufzubauen, bevor die nächste Runde des Wettbewerbs beginnt.

5. Die Schleife (Iterieren)

Das System wiederholt diesen Zyklus. Es gibt nicht nur eine Antwort; es verfeinert ständig sein Verständnis, bildet neue Links und sammelt mehr Beweise, bis es sicher genug ist, die endgültige Antwort zu geben.

Was haben sie tatsächlich gebaut?

Die Forscher haben ein funktionierendes Computerprogramm namens CTM-AI entwickelt, das diese „Town Hall"-Struktur verwendet. Sie haben es nicht nur theoretisiert; sie haben es gegen reale Probleme getestet.

Die Tests (die „Prüfungen"):

Verstehen von Humor und Sarkasmus (MUStARD & UR-FUNNY):
- Die Herausforderung: Sarkasmus ist schwierig, weil man den Ton hören, den Gesichtsausdruck sehen und die Worte lesen muss – alles gleichzeitig.
- Das Ergebnis: CTM-AI erzielte die höchsten Scores (rund 72 %) im Vergleich zu anderen fortschrittlichen KI-Modellen. Es schlug Systeme, die versuchen, alles auf einmal zu erledigen, oder Systeme, die einen zentralen Manager verwenden.
Verwenden von Werkzeugen (StableToolBench):
- Die Herausforderung: Eine KI auffordern, einen Taschenrechner zu benutzen, das Wetter zu suchen oder einen Flug zu buchen.
- Das Ergebnis: CTM-AI verbesserte seine Erfolgsrate um über 10 Punkte im Vergleich zu Standard-KI-Agenten. Es wurde besser darin herauszufinden, welches Werkzeug zu verwenden ist und wie man sie kombiniert.
Navigieren im Web (WebArena-Lite):
- Die Herausforderung: Durch Websites zu klicken, um spezifische Informationen zu finden oder eine Aufgabe zu erledigen.
- Das Ergebnis: Es war deutlich besser darin, komplexe Websites zu navigieren als Standard-KI-Agenten.

Warum ist das anders?

Das Papier hebt zwei Hauptunterschiede zwischen CTM-AI und anderen KI-Systemen hervor:

Kein „Chef": Die meisten KI-Systeme haben einen zentralen Manager (wie einen Projektmanager in einem Unternehmen), der Agenten sagt, was zu tun ist. CTM-AI hat keinen Manager. Der „Chef" ist der Wettbewerb selbst. Das macht es flexibler; wenn ein neuer Problemtyp entsteht, braucht das System keinen neuen Manager, es braucht nur die richtigen Experten, um zu konkurrieren und zu gewinnen.
Selbstverbessernde Links: Während das System Probleme löst, lernen die Spezialisten, mit wem sie sprechen sollen. Wenn der „Vision"-Experte immer Hilfe vom „Text"-Experten braucht, bilden sie einen permanenten Link. Im Laufe der Zeit baut das System sein eigenes effizientes Kommunikationsnetzwerk auf, genau wie Menschen lernen, bestimmten Personen in ihrem sozialen Kreis zu vertrauen.

Das Fazit

Das Papier stellt CTM-AI als Blaupause für eine intelligentere, anpassungsfähigere KI vor. Indem es nachahmt, wie menschliches Bewusstsein funktioniert – unter Verwendung eines globalen Arbeitsbereichs, in dem Ideen konkurrieren, gewinnen und sich dann an alle verbreiten –, kann das System komplexe, mehrstufige Probleme besser lösen als aktuelle KI-Systeme mit „einem Gehirn" oder „vom Chef verwaltet".

Wichtiger Hinweis: Die Autoren stellen ausdrücklich fest, dass sie kein bewusstes Wesen bauen. Sie verwenden ein Modell des Bewusstseins als Blaupause, um eine bessere, effektivere Maschine zu bauen. Sie behaupten nicht, dass die KI etwas „fühlt"; sie behaupten, dass die Struktur ihres Denkens sie schlauer macht.

CTM-AI: A Blueprint for General AI Inspired by a Model of Consciousness

Die große Idee: Ein „bewusstes" Team von Experten

Wie es funktioniert: Die „Town Hall"-Analogie

1. Die „unbewusste" Menge (Die Prozessoren)

2. Der „Up-Tree"-Wettbewerb (Wer darf sprechen?)

3. Die „Down-Tree"-Ausstrahlung (Die Ankündigung)

4. Die „Link"-Bildung (Das Flüsternetzwerk)

5. Die Schleife (Iterieren)

Was haben sie tatsächlich gebaut?

Warum ist das anders?

Das Fazit

Technische Zusammenfassung: CTM-AI: Ein Bauplan für allgemeine KI, inspiriert von einem Modell des Bewusstseins

Problemstellung

Methodik: Die CTM-AI-Architektur

Kernkomponenten

Inferenz-Dynamik

Hauptbeiträge

Experimentelle Ergebnisse

Bedeutung und Behauptungen

CTM-AI: A Blueprint for General AI Inspired by a Model of Consciousness

Die große Idee: Ein „bewusstes" Team von Experten

Wie es funktioniert: Die „Town Hall"-Analogie

1. Die „unbewusste" Menge (Die Prozessoren)

2. Der „Up-Tree"-Wettbewerb (Wer darf sprechen?)

3. Die „Down-Tree"-Ausstrahlung (Die Ankündigung)

4. Die „Link"-Bildung (Das Flüsternetzwerk)

5. Die Schleife (Iterieren)

Was haben sie tatsächlich gebaut?

Warum ist das anders?

Das Fazit

Technische Zusammenfassung: CTM-AI: Ein Bauplan für allgemeine KI, inspiriert von einem Modell des Bewusstseins

Problemstellung

Methodik: Die CTM-AI-Architektur

Kernkomponenten

Inferenz-Dynamik

Hauptbeiträge

Experimentelle Ergebnisse

Bedeutung und Behauptungen

Mehr davon