Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

Die Arbeit stellt HAP vor, einen heterogenitätsbewussten Ansatz für das Pre-Ranking in Empfehlungssystemen, der durch die Trennung einfacher und schwieriger Kandidaten sowie eine adaptive Ressourcenallokation Gradientenkonflikte löst und ohne zusätzliche Rechenkosten zu signifikanten Verbesserungen in der Produktion führt.

Pengfei Tong, Siyuan Chen, Chenwei Zhang, Bo Wang, Qi Pi, Pixun Li, Zuotao Liu

Veröffentlicht 2026-03-05
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind der Chef eines riesigen, überfüllten Marktplatzes (wie TikTok oder eine Nachrichten-App), auf dem Millionen von Händlern (den Inhalten) versuchen, Ihre Aufmerksamkeit zu gewinnen. Ihr Job ist es, die besten Angebote für jeden einzelnen Besucher auszuwählen.

Das Problem? Sie haben keine Zeit, jeden einzelnen Händler auf dem riesigen Marktplatz persönlich zu prüfen. Das wäre zu langsam und zu teuer.

Hier kommt das HAP-System (Heterogeneity-Aware Adaptive Pre-ranking) ins Spiel, das von ByteDance entwickelt wurde. Die Forscher haben ein cleveres Problem erkannt und eine Lösung gefunden, die wir uns wie folgt vorstellen können:

1. Das Problem: Der "Lärm" auf dem Marktplatz

Stellen Sie sich vor, Sie müssen aus einer Menge von 10.000 Händlern die besten 100 auswählen.

  • Die leichten Fälle: 9.000 Händler verkaufen offensichtlich Müll (z. B. kaputte Schuhe oder Spam). Jeder kann sofort erkennen, dass diese schlecht sind.
  • Die harten Fälle: 999 Händler verkaufen gute Ware, aber es ist schwer zu sagen, wer von ihnen der beste ist. Sie sehen sich fast alle gleich gut an.
  • Das Problem: Bisherige Systeme haben versucht, alle 10.000 Händler mit demselben, sehr komplexen und teuren "Experten-Team" zu bewerten. Das ist wie wenn Sie einen Nobel-Privatdetektiv (ein riesiges KI-Modell) schicken, um zu prüfen, ob ein Apfel faul ist. Das kostet zu viel Zeit und Geld für etwas, das jeder sehen kann.

Zusätzlich gab es ein Lern-Problem: Wenn das KI-System lernte, wurden die "schwierigen" Fälle (die fast perfekten Händler) so laut und aggressiv, dass sie das Lernen der "leichten" Fälle komplett überstimmten. Das System lernte nur, wie man die Schweren erkennt, und vergaß, wie man die Leichten schnell aussortiert.

2. Die Lösung: Ein zweistufiges Filter-System (HAP)

Die Forscher haben HAP entwickelt, das wie ein zweistufiger Sicherheitscheck funktioniert:

Schritt A: Der schnelle Torwächter (Leichtes Modell)

Zuerst läuft alles durch einen schnellen, einfachen "Torwächter".

  • Was er macht: Er schaut sich die 10.000 Händler an und filtert sofort die 9.000 offensichtlichen Müllhändler heraus.
  • Warum das gut ist: Er ist schnell, billig und braucht wenig Energie. Er muss nicht wissen, warum ein Händler gut ist, er muss nur wissen, dass er schlecht ist.
  • Das Ergebnis: Von den 10.000 bleiben nur noch die 1.000 besten übrig.

Schritt B: Der Spezialist (Schweres Modell)

Nur die verbleibenden 1.000 "schwierigen" Kandidaten werden dem teuren "Nobel-Privatdetektiv" (dem großen KI-Modell) vorgelegt.

  • Was er macht: Er analysiert diese wenigen Kandidaten im Detail, um die absolut besten 100 zu finden.
  • Warum das gut ist: Der teure Experte wird nicht mit Müll belastet. Er kann sich voll auf die schwierigen Entscheidungen konzentrieren.

3. Der geheime Kleber: "Gradient-Harmonized Contrastive Learning" (GHCL)

Das ist der wissenschaftliche Teil, den man sich wie eine kluge Moderation vorstellen kann.

Stellen Sie sich vor, das KI-System lernt in einem Klassenzimmer.

  • Das alte Problem: Die "schwierigen" Schüler (die fast perfekten Händler) schrien so laut, dass die "leichten" Schüler (die offensichtlichen Müllhändler) gar nicht gehört wurden. Das System wurde verrückt und lernte nur die Schreie.
  • Die HAP-Lösung: Der Lehrer (das HAP-System) teilt die Klasse in zwei Gruppen ein.
    • Gruppe 1 (Leicht): Hier üben sie mit einfachen Aufgaben.
    • Gruppe 2 (Schwer): Hier üben sie mit kniffligen Aufgaben.
    • Der Trick: Der Lehrer sorgt dafür, dass beide Gruppen gleichzeitig lernen, aber die lauten Schreie der einen Gruppe die andere nicht stören. Er "harmonisiert" die Lautstärke. So lernt das System stabil und schnell, ohne sich zu verirren.

4. Das Ergebnis: Schneller, besser, günstiger

Durch diese Methode hat ByteDance in seiner App "Toutiao" (ähnlich wie TikTok) folgende Erfolge erzielt:

  • Die Nutzer bleiben länger: Die Leute schauen sich mehr Videos an (die App wird "klebriger").
  • Die Nutzer kommen öfter: Mehr aktive Tage pro Woche.
  • Keine extra Kosten: Obwohl das System intelligenter ist, kostet es nicht mehr Rechenleistung. Im Gegenteil, es ist sogar effizienter, weil der teure Experte nicht mehr mit Müll beschäftigt wird.

Zusammenfassend:
HAP ist wie ein kluger Manager, der weiß, dass nicht jeder Mitarbeiter das gleiche Gehalt verdient. Er schickt die einfachen Aufgaben an die Praktikanten (schnell und billig) und behält die kniffligen Fälle für die Top-Experten (teuer und präzise). Gleichzeitig sorgt er dafür, dass im Team niemand so laut schreit, dass die anderen nicht lernen können. Das Ergebnis ist ein glücklicheres Publikum und ein glücklicheres Unternehmen.