Tailored Behavior-Change Messaging for Physical Activity: Integrating Contextual Bandits and Large Language Models

Diese Studie stellt einen hybriden Ansatz vor, der kontextuelle Banditen zur Auswahl von Interventionsarten mit großen Sprachmodellen zur personalisierten Inhaltsgenerierung kombiniert, um in einer 30-tägigen physischen Aktivitätsintervention die Akzeptanz zu erhöhen, den Token-Verbrauch zu senken und eine nachvollziehbare, adaptive Entscheidungsfindung zu ermöglichen.

Haochen Song, Dominik Hofer, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Zahra Hassanzadeh, Jan Smeddinck, Meredith Franklin, Joseph Jay Williams

Veröffentlicht 2026-03-04
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie versuchen, ein neues Hobby zu lernen – sagen wir, täglich mehr zu laufen. Sie haben einen digitalen Coach an Ihrer Seite, der Sie jeden Tag ermutigt. Aber wie sollte dieser Coach vorgehen? Sollte er immer denselben Satz sagen? Oder sollte er genau wissen, wie Sie sich gerade fühlen, und seine Worte darauf abstimmen?

Dieser Forschungsbericht beschreibt genau das: Ein neues, intelligentes System, das versucht, die perfekte Motivation für jeden einzelnen Menschen zu finden. Es kombiniert zwei sehr unterschiedliche Technologien, wie ein kluger Dirigent und ein kreativer Dichter.

Hier ist die einfache Erklärung, wie das funktioniert:

1. Das Problem: Der „Einheits-Schuh" passt nicht allen

Früher haben digitale Gesundheits-Apps oft wie ein Stempel funktioniert. Egal, ob Sie müde, gestresst oder voller Energie waren, die App schickte immer die gleiche Nachricht: „Geh heute 30 Minuten spazieren!"
Das Problem: Manchmal passt das nicht. Wenn Sie gestresst sind, brauchen Sie vielleicht eine sanfte Ermutigung, keine harte Anweisung. Wenn Sie sich gut fühlen, wollen Sie vielleicht einen Wettbewerb.

2. Die zwei Helden des Systems

Das neue System nutzt zwei Helden, die zusammenarbeiten:

  • Held 1: Der kluge Dirigent (Der „Contextual Bandit")
    Stellen Sie sich einen Dirigenten vor, der ein Orchester leitet. Er sieht das Publikum (Sie) und weiß: „Heute ist das Publikum müde, also spielen wir ein ruhiges Stück." Oder: „Heute ist das Publikum energisch, also spielen wir etwas Aufregendes!"
    In der Technik heißt das „Contextual Multi-Armed Bandit". Er ist ein Algorithmus, der lernt, welche Art von Nachricht (z. B. „Vergleiche dich mit anderen" oder „Denke an die Vorteile") am besten funktioniert, basierend auf Ihrem aktuellen Zustand (Ihrer Stimmung, Ihrem Stresslevel). Er trifft die strategische Entscheidung: „Welche Taktik wählen wir heute?"

  • Held 2: Der kreative Dichter (Der „Large Language Model" oder LLM)
    Der Dirigent sagt dem Dichter: „Heute spielen wir ein ruhiges Stück." Aber der Dichter (eine fortschrittliche KI wie ChatGPT) schreibt den Text. Er passt die Worte, den Tonfall und die Metaphern genau auf Ihre Situation an.
    Statt nur einen starren Satz zu senden, schreibt der Dichter: „Ich weiß, der Tag war lang. Ein kurzer Spaziergang könnte dir helfen, den Kopf freizubekommen, wie ein frischer Wind nach einem Sturm."

3. Die große Idee: Die perfekte Kombination

Bisher haben Forscher oft nur den Dirigenten oder nur den Dichter benutzt.

  • Nur der Dirigent (starre Vorlagen): Zu starr, nicht persönlich genug.
  • Nur der Dichter (KI): Sehr kreativ, aber manchmal unvorhersehbar und teuer in der Anwendung.

Die Forscher haben einen Hybrid-Ansatz entwickelt: Der Dirigent wählt die Strategie, der Dichter schreibt den Text.

  • Der Dirigent (cMAB) schaut auf Ihre Daten (Stress, Selbstvertrauen, soziale Umgebung) und entscheidet: „Heute brauchen wir eine Nachricht, die die Vorteile des Laufens betont (Gain-Framing)."
  • Der Dichter (LLM) nimmt diese Anweisung und schreibt eine Nachricht, die genau zu Ihrem heutigen Tag passt, basierend auf dem, was Sie ihm über Ihren Tag erzählt haben.

4. Was hat das Experiment ergeben?

Die Forscher haben das 30 Tage lang mit echten Menschen getestet. Die Ergebnisse waren sehr spannend:

  • Die persönliche Note zählt: Die Nachrichten, die von der KI (dem Dichter) persönlich geschrieben wurden, kamen viel besser an als die starren Standard-Nachrichten. Die Leute fühlten sich verstanden.
  • Die Strategie ist trotzdem wichtig: Es reichte nicht, nur nette Worte zu finden. Es war entscheidend, welche Art von Nachricht gewählt wurde. Nachrichten, die die Vorteile betonten („Du wirst energischer!"), funktionierten besser als solche, die die Nachteile betonten („Wenn du nicht läufst, wirst du krank!").
  • Die beste Lösung: Die Kombination aus Dirigent und Dichter war der Gewinner. Sie war genauso gut wie ein reiner KI-Dichter, aber sie war effizienter (weniger Rechenleistung nötig) und durchschaubarer. Man wusste genau, warum eine bestimmte Strategie gewählt wurde, weil der Dirigent eine klare Regel hatte.

5. Warum ist das wichtig?

Stellen Sie sich vor, Sie hätten einen persönlichen Trainer, der nicht nur weiß, was Sie tun sollen, sondern auch genau weiß, wie er es Ihnen sagen muss, damit Sie es wirklich tun.

Dieses System ist wie ein Schneider, der Maß nimmt. Der Dirigent misst Ihre Figur (Ihre Situation), und der Dichter schneidet den Anzug (die Nachricht) perfekt zu. Das Ergebnis ist, dass Menschen eher motiviert bleiben und ihre Ziele erreichen, ohne sich von einer starren Maschine bevormundet zu fühlen.

Zusammenfassend:
Die Forscher haben gezeigt, dass man die kluge Strategie eines Computers (der weiß, was funktioniert) mit der kreativen Sprache einer KI (die weiß, wie man es sagt) verbinden kann. Das führt zu besseren Ergebnissen als jede der beiden Methoden allein – und das alles, ohne dass der Computer „verrückt" wird oder zu viel Geld kostet.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →