When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Die vorgestellte Arbeit stellt Co-Evolutionary Alignment (CoEA) vor, eine Methode, die durch ein Dual-Stable Interest Exploration-Modul und einen Periodic Collaborative Optimization-Mechanismus die Verzerrungen bei der Interessenmodellierung und statische Optimierungsprobleme in LLM-basierten Empfehlungssystemen adressiert, um eine dynamische, geschlossene Schleife für serendipitäre Empfehlungen zu ermöglichen.

Hongxiang Lin, Hao Guo, Zeshun Li, Erpeng Xue, Yongqian He, Zhaoyu Hu, Lei Wang, Sheng Chen, Long Zeng

Veröffentlicht 2026-03-05
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie gehen in ein riesiges, unendliches Einkaufszentrum. Der Verkäufer, der Ihnen immer wieder genau die gleichen Schuhe zeigt, die Sie schon letztes Jahr gekauft haben, ist wie ein herkömmlicher Empfehlungsalgorithmus. Er ist zwar zuverlässig, aber er langweilt Sie. Sie kommen in eine „Filterblase": Sie sehen nur das, was Sie ohnehin schon kennen, und entdecken nie etwas Neues. Das nennt man „Content Fatigue" (Inhaltsmüdigkeit).

Die Forscher von Meituan und der Tsinghua-Universität haben nun eine neue Methode namens CoEA entwickelt, um dieses Problem zu lösen. Ihr Ziel ist die „serendipitöse Empfehlung": das glückliche Entdecken von etwas Überraschendem, das Sie lieben werden, ohne dass Sie danach gesucht haben.

Hier ist die Erklärung ihrer Lösung, übersetzt in einfache Bilder und Analogien:

1. Das Problem: Der vergessliche und der starre Verkäufer

Bisherige Systeme mit Künstlicher Intelligenz (KI) hatten zwei große Schwächen:

  • Sie vergaßen, wer Sie wirklich sind: Sie schauten nur auf das, was Sie gestern gekauft haben (kurzfristige Interessen), und ignorierten, wer Sie im Kern sind (z. B. ein „Technik-Enthusiast" oder ein „Reisefan"). Das ist, als würde ein Verkäufer nur auf Ihre letzte Handlung schauen und vergessen, dass Sie seit Jahren gerne wandern.
  • Sie waren starr: Sobald die KI einmal gelernt hatte, was neu ist, hörte sie auf zu lernen. Sie passte sich nicht an, wenn sich Ihre Vorlieben langsam änderten.

2. Die Lösung: Ein duales Team mit einem Gedächtnis

Die Forscher haben ein System gebaut, das wie ein zweiköpfiges Beratungsteam funktioniert, das in einem ständigen Gespräch steht.

Teil A: Der „Stabile Kompass" (DSIE-Modul)

Stellen Sie sich vor, Sie haben zwei Arten von Erinnerungen:

  1. Das Langzeit-Gedächtnis (Die Gruppe): Hier wird gespeichert, wer Sie im Großen und Ganzen sind. Die KI gruppiert Sie mit Tausenden anderen Menschen, die ähnliche tiefe Vorlieben haben (z. B. „Die Gruppe der Hobby-Köche"). Das nennt sie „Gruppen-ID".
  2. Das Kurzzeit-Gedächtnis (Der Moment): Hier wird gespeichert, was Sie gerade interessiert (z. B. „Heute habe ich nach einem Backofen gesucht").

Die Magie: Das System schaut nicht nur auf das, was Sie gerade tun, sondern kombiniert es mit Ihrer „Gruppen-ID". Es sagt: „Ah, du bist ein Hobby-Koch (Langzeit), aber heute suchst du nach Backofen-Zubehör (Kurzzeit). Vielleicht magst du ja auch neue Rezepte für asiatische Gerichte, die du noch nie probiert hast?"
So vermeidet es, dass die Empfehlungen nur oberflächlich oder zufällig sind.

Teil B: Der „Tanz des Fortschritts" (PCO-Mechanismus)

Das ist der coolste Teil. Früher war das Training der KI wie ein Einweg-Flug: Man trainierte sie einmal, und dann war sie fertig.
CoEA ist wie ein Tanzpartner-Training, das nie aufhört:

  1. Der Entdecker (Novelty LLM): Dieser KI-Teil schlägt verrückte, neue Ideen vor. „Probier doch mal Yoga-Matten aus!"
  2. Der Prüfer (Relevance LLM): Dieser KI-Teil ist der strenge, aber faire Chef. Er sagt: „Moment, passt das zu diesem Kunden? Wenn ja, gut. Wenn nein, streichen."
  3. Der Rückkopplungs-Kreislauf:
    • Der Prüfer gibt dem Entdecker Feedback: „Das war gut, aber das hier war zu weit weg."
    • Der Entdecker lernt daraus sofort und wird für das nächste Mal besser.
    • Wichtig: Der Prüfer wird auch aktualisiert, basierend auf dem, was der Entdecker neu gelernt hat.
    • Dieser Prozess wiederholt sich regelmäßig (periodisch). Es ist wie ein ständiges Training, bei dem beide Partner sich gegenseitig verbessern, ohne dass der eine den anderen vergisst (das nennt man „katastrophales Vergessen" zu vermeiden).

3. Das Ergebnis: Zufriedene Kunden und glückliche Überraschungen

In Tests (sowohl mit Movie-Daten als auch mit echten Daten von der Meituan-App in China) hat sich gezeigt:

  • Die Nutzer bekamen bessere Empfehlungen (sie fanden, was sie suchten).
  • Gleichzeitig entdeckten sie viel mehr Neues (sie fanden Dinge, die sie lieben, aber nie erwartet hätten).
  • Im echten Leben (Online-Test) führte das sogar zu mehr Umsatz für das Unternehmen, weil die Nutzer glücklicher waren und mehr kauften.

Zusammenfassung in einem Satz

Stellen Sie sich CoEA wie einen weisen Freund vor, der nicht nur weiß, was Sie heute essen wollen, sondern auch, wer Sie sind (Ihre langfristigen Leidenschaften), und der Sie ständig daran erinnert, neue Dinge auszuprobieren – aber immer so, dass es sich für Sie natürlich und passend anfühlt, weil er sich ständig an Ihre sich ändernden Vorlieben anpasst.

Das System löst das Dilemma: „Soll ich nur das geben, was der Kunde will (langweilig), oder etwas Neues (riskant)?" CoEA sagt: „Wir geben ihm das Neue, aber auf eine Weise, die perfekt zu seinem wahren Ich passt."