HumanLM: Simulating Users with State Alignment Beats Response Imitation

Die Arbeit stellt HumanLM vor, ein neuartiges Trainingsframework, das durch die Ausrichtung von latenten, psychologisch fundierten Zuständen mittels Reinforcement Learning realistische Nutzer-Simulationen erzeugt und damit bestehende Ansätze, die lediglich Oberflächenmuster imitieren, signifikant übertrifft.

Shirley Wu, Evelyn Choi, Arpandeep Khatua, Zhanghan Wang, Joy He-Yueya, Tharindu Cyril Weerasooriya, Wei Wei, Diyi Yang, Jure Leskovec, James Zou

Veröffentlicht 2026-03-05
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du möchtest einen digitalen Doppelgänger erschaffen. Nicht nur einen, der aussieht wie du, sondern einen, der genau so denkt, fühlt und reagiert wie du, wenn er eine Nachricht liest oder eine Nachricht bekommt.

Das ist das Ziel des Papers „HUMANLM". Aber die Forscher haben ein Problem bemerkt: Bisherige KI-Modelle waren wie schlechte Schauspieler. Sie konnten deine Worte und deinen Slang perfekt nachahmen (z. B. viele Ausrufezeichen oder Emojis benutzen), aber sie verstanden nicht, warum du sie benutzt hast. Sie ahmten nur die Oberfläche nach, nicht das Herz.

Hier ist die einfache Erklärung der Lösung, HUMANLM, mit ein paar anschaulichen Vergleichen:

1. Das Problem: Der „Plastik-Puppen"-Effekt

Stell dir vor, du bist wütend, weil eine neue Politik deine Stadt schädigt.

  • Die alte KI (SFT): Sie lernt, dass du oft Wörter wie „schrecklich" oder „katastrophal" benutzt. Wenn sie eine neue Nachricht liest, sagt sie: „Oh, das ist schrecklich!" – aber sie sagt es mit einer glatten, höflichen Stimme, die gar nicht zu deiner echten Wut passt. Sie hat nur die Fassade kopiert, nicht das Gefühl.
  • Das Ergebnis: Die KI klingt wie du, aber sie fühlt sich nicht wie du an. Sie verpasst den Kern deiner Reaktion.

2. Die Lösung: HUMANLM – Der „Gedanken-Architekt"

HUMANLM macht etwas ganz anderes. Es baut nicht nur die Fassade, sondern rekonstruiert zuerst das Fundament.

Stell dir vor, du willst ein Haus bauen (deine Antwort).

  • Die alte Methode: Sie schaut sich ein Foto von deinem fertigen Haus an und versucht, es Stein für Stein nachzubauen. Wenn sie einen Stein vergisst, ist das Haus krumm.
  • Die HUMANLM-Methode: Bevor sie den ersten Stein setzt, erstellt sie einen Bauplan aus deinen inneren Zuständen. Sie fragt sich:
    • Was denke ich gerade? (Mein Glaube: „Die Regierung ist unfähig.")
    • Was fühle ich? (Meine Emotion: „Tiefe Enttäuschung und Wut.")
    • Was will ich erreichen? (Mein Ziel: „Andere zum Nachdenken bringen.")
    • Wie spreche ich? (Meine Art: „Direkt und etwas sarkastisch.")

Diese inneren Zustände nennt das Paper „Latente Zustände". Das sind die unsichtbaren Motoren, die deine Worte antreiben.

3. Wie lernt die KI das? (Der „Coaching"-Vergleich)

Normalerweise lernt eine KI, indem sie tausende Beispiele liest und versucht, das nächste Wort vorherzusagen. Das ist wie ein Schüler, der eine Prüfung auswendig lernt, ohne den Stoff zu verstehen.

HUMANLM nutzt einen Coaching-Prozess:

  1. Der Plan: Die KI generiert zuerst ihren „Gedankenplan" (die latenten Zustände).
  2. Der Prüfer: Ein anderer, sehr kluger KI-Richter (ein „Judge") vergleicht diesen Plan nicht mit dem Originalwort für Wort, sondern fragt: „Passt dieser Gedankengang zu dem, was ein echter Mensch in dieser Situation fühlen würde?"
  3. Die Belohnung: Wenn der Plan (z. B. „Ich fühle mich betrogen") mit dem echten Gefühl des Menschen übereinstimmt, bekommt die KI eine Belohnung.
  4. Das Ergebnis: Die KI lernt, dass es wichtiger ist, den richtigen inneren Zustand zu treffen, als nur die richtigen Wörter zu wählen. Erst wenn der Plan steht, schreibt sie die Antwort.

4. Der Test: Der „Blind-Test" mit echten Menschen

Um zu beweisen, dass es funktioniert, haben die Forscher 111 echte Menschen gebeten, auf einen Reddit-Post zu antworten. Dann haben sie die Antworten der KI mit den echten Antworten verglichen.

  • Das Ergebnis: Die Menschen sagten: „Wow, diese KI-Antwort klingt fast genau so, als hätte ich sie selbst geschrieben."
  • Der Vergleich: Andere KIs klangen wie Roboter, die versuchen, menschlich zu klingen. HUMANLM klang wie ein echter Mensch, der gerade eine echte Meinung hat.

Zusammenfassung in einem Satz

Während andere KIs versuchen, deine Stimme zu kopieren (wie ein Papagei), hat HUMANLM gelernt, deine Seele zu simulieren (wie ein Schauspieler, der die Rolle wirklich versteht), indem es zuerst deine Gedanken, Gefühle und Werte analysiert, bevor es überhaupt ein Wort schreibt.

Das macht die KI nicht nur besser im Nachahmen, sondern viel nützlicher, um vorherzusagen, wie echte Menschen auf neue Ideen, Politik oder Produkte reagieren werden.