When & How to Write for Personalized Demand-aware Query Rewriting in Video Search

Das Paper stellt WeWrite vor, ein personalisiertes, bedarfsgesteuertes Framework für die Suchanfrage-Umschreibung in Videosuchsystemen, das durch eine automatische Mustererkennung für den Schreibzeitpunkt, ein hybrides Trainingsverfahren aus SFT und GRPO sowie eine latenzarme Architektur die Klickrate für Videos über 10 Sekunden um 1,07 % steigert und die Neukonfiguration von Suchanfragen um 2,97 % senkt.

Cheng cheng, Chenxing Wang, Aolin Li, Haijun Wu, Huiyun Hu, Juyuan Wang

Veröffentlicht 2026-02-23
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind in einer riesigen, lauten Videobibliothek (wie WeChat Channels) und suchen nach etwas Bestimmtem. Sie tippen nur zwei Wörter ein: „Guang Liang".

Das Problem: Die Bibliothekarin (der Suchalgorithmus) weiß nicht, ob Sie den Sänger Guang Liang oder die Schnapsmarke Guang Liang meinen. Wenn Sie nur nach dem Sänger suchen, aber die Schnapsmarke angezeigt bekommen, sind Sie frustriert.

Das ist das Problem, das die Autoren dieses Papiers mit ihrer neuen Erfindung namens „WeWrite" lösen wollen. Hier ist die Erklärung, wie das funktioniert, ganz einfach und mit ein paar bildhaften Vergleichen:

1. Das große Dilemma: Wann soll man eingreifen?

Stellen Sie sich vor, Sie haben einen sehr hilfsbereiten, aber manchmal etwas übertriebenen Assistenten.

  • Der alte Weg: Der Assistent versucht, jede Ihrer Suchanfragen umzuformulieren, auch wenn Sie eigentlich schon genau wissen, was Sie wollen. Das ist wie jemand, der Ihnen hilft, die Schuhe zu binden, obwohl Sie gerade nur schnell zum Briefkasten laufen wollen. Das nervt und führt zu Fehlern (man nennt das im Papier „Intent Drift" – die Absicht geht verloren).
  • Die WeWrite-Lösung: Der Assistent lernt erst einmal, WANN er eingreifen muss.
    • Er beobachtet Ihre Geschichte: Haben Sie kürzlich viele Videos über Schnaps gesehen? Dann ist es wahrscheinlich, dass Sie die Marke meinen.
    • Er schaut auf Ihre Reaktion: Wenn Sie nach „Guang Liang" suchen, sofort die Seite verlassen und sofort wieder eine neue Suche starten, weiß er: „Aha, die erste Antwort war falsch!"
    • Die Analogie: Es ist wie ein erfahrener Butler, der weiß, wann er Ihnen einen Regenschirm reicht (wenn es regnet) und wann er es besser lässt (wenn die Sonne scheint). Er greift nur ein, wenn es wirklich nötig ist.

2. Das zweite Problem: Wie schreibt man richtig?

Angenommen, der Assistent weiß, dass er helfen muss. Wie formuliert er die Suche dann?

  • Das Problem: Wenn ein KI-Modell (ein großes Sprachmodell) einfach nur kreativ ist, könnte es etwas Erfinden, das im Suchsystem gar nicht existiert. Das wäre wie wenn der Assistent Ihnen sagt: „Suchen Sie nach 'Gläserne Wolken'". Aber in der Bibliothek gibt es keine Gläsernen Wolken. Die Suche wäre leer.
  • Die WeWrite-Lösung: Sie haben eine spezielle Trainingsmethode entwickelt.
    • Schritt 1 (SFT): Der Assistent lernt aus Beispielen, wie man Suchanfragen umschreibt.
    • Schritt 2 (GRPO - Die Belohnung): Hier kommt der Clou. Der Assistent bekommt keine Punkte dafür, wie „kreativ" er ist, sondern dafür, ob seine neue Suchanfrage funktioniert.
    • Die Analogie: Stellen Sie sich vor, der Assistent spielt ein Videospiel. Er darf nicht einfach irgendetwas tippen. Er bekommt Punkte nur dann, wenn er einen Treffer landet (ein Video findet, das Sie wirklich ansehen). Wenn er etwas erfindet, das nicht existiert, bekommt er eine Strafe. So lernt er, kreativ zu sein, aber immer innerhalb der Grenzen dessen, was die Bibliothek tatsächlich hat.

3. Das dritte Problem: Die Geschwindigkeit (Warum dauert das nicht ewig?)

KI-Modelle sind oft langsam. In einer Live-Suche darf es aber keine Verzögerung geben. Wenn Sie auf „Suchen" klicken, wollen Sie sofort Ergebnisse sehen, nicht 2 Sekunden warten, bis der Assistent nachdenkt.

  • Die WeWrite-Lösung: Sie nutzen eine Technik namens „Fake Recall" (Fake-Erinnerung).
  • Die Analogie:
    • Normalerweise würde der Assistent erst nachdenken, dann zur Bibliothek laufen, die Regale durchsuchen und dann zurückkommen. Das dauert.
    • Bei WeWrite läuft alles parallel. Während die normale Suche (die schnellen, alten Methoden) schon losläuft, denkt der Assistent im Hintergrund parallel nach.
    • Der Assistent hat sich vorher eine Liste mit den besten Ergebnissen für die häufigsten Suchanfragen vorbereitet (eine Art „Vorratsschrank"). Wenn er eine neue Idee hat, schaut er sofort in diesen Vorratsschrank, statt erst die ganze Bibliothek zu durchsuchen.
    • Am Ende werden die Ergebnisse der normalen Suche und die des Assistenten einfach zusammengeklebt. Da der Assistent im Hintergrund gearbeitet hat, merken Sie keine Verzögerung. Es fühlt sich an, als wäre er immer schon da gewesen.

Das Ergebnis

Durch diese drei Tricks (Wann eingreifen, Wie schreiben ohne zu erfinden, und wie man es schnell macht) hat das Team getestet, wie gut es funktioniert:

  • Die Leute haben mehr Videos angeschaut (die, die sie länger als 10 Sekunden sehen).
  • Die Leute mussten seltener ihre Suche korrigieren (sie mussten nicht mehr zweimal tippen, weil die erste Antwort falsch war).

Zusammenfassend:
WeWrite ist wie ein super-intelligenter Bibliothekar, der genau weiß, wann er Ihnen helfen soll, der nicht zu kreativ ist (sondern das findet, was wirklich da ist), und der so schnell arbeitet, dass Sie gar nicht merken, dass er überhaupt mitgedacht hat.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →