SOLAR: SVD-Optimized Lifelong Attention for Recommendation

Das Paper stellt SOLAR vor, ein Empfehlungssystem-Framework, das durch die Einführung von SVD-Attention die quadratische Komplexität der Transformer-Aufmerksamkeit auf lineare Komplexität reduziert, während die Softmax-Funktion erhalten bleibt, und ermöglicht so die effiziente Verarbeitung extrem langer Verhaltenssequenzen, was in der Online-Empfehlung von Kuaishou zu messbaren Verbesserungen der Videoaufrufe führt.

Chenghao Zhang, Chao Feng, Yuanhao Pu, Xunyong Yang, Wenhui Yu, Xiang Li, Yongqi Liu, Lantao Hu, Kaiqiao Zhan, Han Li, Kun Gai

Veröffentlicht 2026-03-04
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du bist ein Talent-Scout für eine riesige Talentagentur (das ist dein Empfehlungssystem, z. B. für Videos auf Kuaishou). Deine Aufgabe ist es, für jeden Besucher der Agentur die perfekten Videos aus einer Bibliothek von 10.000 Videos auszuwählen, basierend auf dessen Lebensgeschichte von vielleicht 10.000 früheren Klicks.

Das Problem: Der klassische Weg, wie Computer das bisher gemacht haben, ist wie ein extrem ineffizientes Büro.

Das alte Problem: Der "Alles-mit-Alles-Vergleich"

Bisher hat der Computer für jeden einzelnen der 10.000 Kandidaten-Videos geprüft: "Wie passt dieses Video zu jedem einzelnen der 10.000 Klicks in der Vergangenheit?"

  • Das sind 100 Millionen Vergleiche pro Person.
  • Stell dir vor, du müsstest in einem Raum mit 10.000 Leuten stehen und mit jedem einzelnen von ihnen ein Gespräch führen, um zu entscheiden, wer der beste Freund ist. Das dauert ewig und kostet enorm viel Energie.
  • Um das Problem zu lösen, haben andere Systeme bisher oft gefiltert: "Ignorieren wir einfach die letzten 9.000 Klicks und schauen nur auf die letzten 50." Das ist wie ein Scout, der nur die letzten 50 Bewerber betrachtet und vergisst, dass der Kandidat vielleicht vor 10 Jahren schon einmal ein wichtiges Talent gezeigt hat.

Die neue Lösung: SOLAR (Der clevere Architekt)

Die Forscher haben eine neue Methode namens SOLAR entwickelt. Der Name steht für SVD-Optimized Lifelong Attention for Recommendation. Klingt kompliziert? Ist es eigentlich nicht. Hier ist die einfache Erklärung mit Analogien:

1. Das Geheimnis: "Das Muster im Chaos"

Die Forscher haben bemerkt, dass die Daten der Nutzer nicht wirklich chaotisch sind. Wenn man die 10.000 Klicks eines Nutzers genau analysiert, stellt man fest: Die meisten Klicks wiederholen sich in Mustern.

  • Die Analogie: Stell dir vor, ein Nutzer hat 10.000 Videos angesehen. Vielleicht waren 9.000 davon "Kochvideos", 800 "Reisevideos" und 200 "Katzenvideos".
  • Der Computer braucht nicht jeden einzelnen Klick einzeln zu speichern. Er kann die wesentlichen Muster (die "Koch-Grundidee", die "Reise-Grundidee") extrahieren.
  • In der Mathematik nennt man das SVD (Singulärwertzerlegung). Stell dir das wie einen Kompressor vor, der einen riesigen Haufen Papier (die 10.000 Klicks) in einen dünnen, aber informativen Stapel (die wenigen Muster) verwandelt, ohne Informationen zu verlieren.

2. Die neue Technik: "SVD-Attention"

Anstatt mit jedem der 10.000 Klicks zu reden, redet der Computer jetzt nur noch mit den wenigen Mustern (z. B. nur mit den 50 wichtigsten Themen).

  • Der Effekt: Statt 100 Millionen Gespräche führt der Computer nur noch 500 Gespräche.
  • Das Ergebnis: Die Geschwindigkeit steigt enorm, der Speicherbedarf sinkt, und – das ist das Wichtigste – man muss nichts wegwerfen. Der Scout sieht alles, aber er verarbeitet es intelligent, indem er die Wiederholungen zusammenfasst.

3. Der "Set-Weise" Ansatz: "Die Gruppe vor dem Einzelnen"

Früher hat der Computer jedes Video einzeln bewertet: "Ist Video A gut?"
SOLAR schaut sich die ganze Gruppe an: "Welche 10 Videos passen zusammen am besten zu diesem Nutzer?"

  • Die Analogie: Ein alter Scout sagt: "Ich mag Pizza." (Punkt-für-Punkt).
  • Ein SOLAR-Scout sagt: "Ich mag Pizza, aber nur wenn daneben auch ein Salat und ein Cola steht, weil der Nutzer heute Abend eine Party plant."
  • Das System versteht den Kontext. Es weiß, dass die Wahl eines Videos davon abhängt, welche anderen Videos gerade zur Auswahl stehen.

Warum ist das so wichtig? (Die Ergebnisse)

  • Geschwindigkeit: Das System ist so schnell, dass es in Echtzeit funktioniert, selbst wenn es 10.000 Klicks in der Geschichte und 3.000 Kandidaten gibt.
  • Qualität: In Tests bei Kuaishou (einer riesigen chinesischen Video-Plattform) hat SOLAR die Video-Ansichten um 0,68% gesteigert.
    • Klingt wenig? Bei Milliarden von Nutzern sind das Millionen zusätzliche Views und viel mehr Geld für die Plattform.
  • Kein Filtern mehr: Man muss nicht mehr die "alten" Klicks löschen. Die ganze Lebensgeschichte des Nutzers fließt ein, was zu viel besseren Empfehlungen führt.

Zusammenfassung in einem Satz

SOLAR ist wie ein genialer Bibliothekar, der nicht jeden einzelnen der 10.000 Bücher einzeln durchsucht, sondern sofort erkennt, welche 50 Themen sich darin wiederholen, und basierend darauf die perfekte Auswahl für den Besucher trifft – schneller, genauer und ohne etwas Wichtiges zu übersehen.

Das Paper beweist also: Man muss nicht die "Intelligenz" opfern, um schneller zu sein. Man muss nur klüger rechnen, indem man die versteckten Muster in den Daten nutzt.