Generative Recommendation for Large-Scale Advertising

Das Paper stellt GR4AD vor, ein produktionsreifes generatives Empfehlungssystem für Kuaishous großflächige Werbung, das durch innovative Komponenten wie UA-SID-Tokenisierung, LazyAR-Decodierung und RSPO-Optimierung eine signifikante Umsatzsteigerung bei gleichzeitiger effizienter Echtzeit-Skalierung ermöglicht.

Ben Xue, Dan Liu, Lixiang Wang, Mingjie Sun, Peng Wang, Pengfei Zhang, Shaoyun Shi, Tianyu Xu, Yunhao Sha, Zhiqiang Liu, Bo Kong, Bo Wang, Hang Yang, Jieting Xue, Junhao Wang, Shengyu Wang, Shuping Hui, Wencai Ye, Xiao Lin, Yongzhi Li, Yuhang Chen, Zhihui Yin, Quan Chen, Shiyang Wen, Wenjin Wu, Han Li, Guorui Zhou, Changcheng Li, Peng Jiang

Veröffentlicht 2026-03-05
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du betreibst einen riesigen, digitalen Supermarkt – nennen wir ihn „Kuaishou". In diesem Supermarkt gibt es Millionen von Produkten (Werbungen), und du musst für jeden einzelnen Besucher genau das richtige Produkt auf den Tisch legen, damit er es kauft.

Bisher haben Computer das mit einem sehr starren System gemacht: Sie haben eine riesige Datenbank durchsucht und die Produkte verglichen, die dem Kunden am ähnlichsten sind. Das funktioniert gut, aber es ist wie ein Roboter, der nur nach einem festen Skript handelt.

Die Forscher von Kuaishou haben nun etwas Neues entwickelt, das sie GR4AD nennen. Man kann sich das wie die Einführung eines super-intelligenten, kreativen Einkaufsberaters vorstellen, der nicht nur vergleicht, sondern denkt und vorausschaut.

Hier ist die Erklärung, wie dieser neue Berater funktioniert, aufgeteilt in vier einfache Teile:

1. Die neue Sprache: UA-SID (Der perfekte Produkt-Code)

Früher hatten Produkte nur langweilige Nummern (wie „Produkt 12345"). Das sagt dem Computer nichts über das Produkt selbst.

  • Das Problem: Ein Video-Werbeclip ist komplex. Es hat Bilder, Musik, Text und einen bestimmten Verkäufer.
  • Die Lösung (UA-SID): Der neue Berater lernt eine neue Sprache. Er schaut sich das Video an und erstellt einen „semantischen Code". Stell dir vor, statt einer Nummer bekommt das Produkt einen poetischen Namen wie „Sonniger Strandurlaub für Familien mit Hund".
  • Der Clou: Der Berater lernt nicht nur aus dem Video, sondern auch aus dem Verhalten der Kunden (welche Produkte wurden oft zusammen gekauft?). So versteht er nicht nur das Bild, sondern auch den Geschmack der Kunden.

2. Der schnelle Denker: LazyAR (Der effiziente Chef)

Wenn ein normaler KI-Modell eine Liste von 10 Produkten vorschlägt, denkt es oft wie ein strenger Lehrer: „Ich muss Schritt 1 perfekt lösen, bevor ich Schritt 2 anfange." Das dauert lange.

  • Das Problem: In der Werbung muss die Antwort in Millisekunden da sein.
  • Die Lösung (LazyAR): Der neue Berater ist ein „fauler" Genie (im positiven Sinne!). Er merkt sich: „Die ersten Schritte sind am wichtigsten, aber die späteren Schritte sind ähnlich."
  • Die Analogie: Stell dir vor, du musst 10 verschiedene Rezepte für einen Kochwettbewerb schreiben. Ein normaler Koch schreibt jedes Rezept von vorne bis hinten. Unser „fauler" Chef schreibt zuerst den allgemeinen Aufbau für alle 10 Rezepte gleichzeitig (das ist der schnelle Teil) und fügt dann nur die letzten, feinen Details hinzu.
  • Das Ergebnis: Er ist doppelt so schnell, liefert aber genauso gute Rezepte.

3. Der geschäftsmäßige Trainer: VSL & RSPO (Nicht nur Klicks, sondern Geld)

Früher hat die KI gelernt: „Was wird am meisten angeklickt?" Das ist gut, aber nicht immer profitabel. Manchmal bringt ein Klick nichts, wenn der Kunde nichts kauft.

  • Das Problem: Die KI muss lernen, was dem Unternehmen wirklich Geld bringt (nicht nur Klicks, sondern Umsatz).
  • Die Lösung (VSL & RSPO):
    • VSL (Der Beobachter): Die KI lernt aus der Vergangenheit, welche Kunden wirklich wertvoll sind. Sie gewichtet die Daten: Ein Klick von jemandem, der oft kauft, zählt mehr als ein Klick von einem „Klicker".
    • RSPO (Der Trainer): Das ist wie ein Trainer, der dem KI-Modell sagt: „Hey, du hast eine Liste mit 5 Produkten erstellt. Aber du hast das teuerste Produkt auf Platz 3 gesetzt! Das war falsch. Versuche es beim nächsten Mal so, dass die besten Produkte ganz oben stehen."
    • Der Trick: Die KI lernt ständig dazu, während sie arbeitet. Sie passt sich sofort an, wenn sich die Kundenwünsche ändern (z. B. plötzlich wollen alle Regenschirme, weil es regnet).

4. Der flexible Dienstleister: Dynamische Beam-Suche (Der Taktgeber)

Stell dir vor, der Berater muss 1000 Kunden pro Sekunde bedienen.

  • Das Problem: Wenn alle Kunden gleichzeitig kommen (Hauptzeit), muss er schnell sein. Wenn es ruhig ist (Nacht), kann er mehr Zeit investieren, um die perfekte Lösung zu finden.
  • Die Lösung (Dynamische Beam-Suche): Der Berater passt seine Arbeitsweise an den Andrang an.
    • Viel Stress (Hauptzeit): Er sucht nur nach den 5 wahrscheinlichsten Optionen, um schnell zu sein.
    • Ruhe (Nacht): Er sucht nach 20 Optionen, um sicherzugehen, dass er das absolut perfekte Produkt findet.
    • Der Cache: Wenn ein Kunde in der nächsten Minute nochmal fragt, nutzt er die Antwort, die er gerade erst berechnet hat, und muss nicht neu nachdenken. Das spart enorm viel Energie.

Das Ergebnis: Ein Gewinn für alle

Dank dieses neuen Systems („GR4AD") hat Kuaishou getestet, wie gut es funktioniert:

  • Mehr Umsatz: Die Werbung bringt bis zu 4,2 % mehr Geld als das alte System.
  • Schneller: Der Berater antwortet in weniger als 100 Millisekunden (schneller als ein Blinzeln).
  • Fairer: Auch kleine Werbetreibende bekommen mehr Aufmerksamkeit, und die Nutzer sehen relevantere Werbung, die sie wirklich interessiert.

Zusammenfassend:
GR4AD ist wie der Wechsel von einem starren Katalog-Verkäufer zu einem lebendigen, mitdenkenden Einkaufsassistenten, der schnell lernt, geschäftstüchtig ist und sich perfekt an den Andrang im Laden anpasst. Er macht das Internet für alle Beteiligten (Kunden, Werbetreibende und die Plattform) profitabler und angenehmer.