Unbiased Rectification for Sequential Recommender Systems Under Fake Orders

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind ein erfahrener Koch in einem beliebten Restaurant. Ihre Aufgabe ist es, basierend auf den Essgewohnheiten Ihrer Gäste genau das Gericht zu empfehlen, das sie lieben werden. Das ist im Grunde, was sequenzielle Empfehlungssysteme tun: Sie schauen sich an, was ein Nutzer in der Vergangenheit gekauft oder angeklickt hat, um vorherzusagen, was er als Nächstes mag.

Doch jetzt passiert etwas Unschönes: Ein rivalisierendes Restaurant schickt eine Gruppe von bezahlten „Fake-Gästen" (oder besser: gefälschte Bestellungen) in Ihr Restaurant. Diese Leute tun so, als wären sie echte Kunden, aber sie bestellen absichtlich Dinge, die nicht zu den echten Vorlieben passen, nur um Ihre Empfehlungsmaschine zu verwirren. Ihr Ziel ist es, dass Ihr System plötzlich ein bestimmtes, minderwertiges Gericht (das des Konkurrenten) empfiehlt, damit dieses mehr verkauft wird.

Das ist das Problem, das die Forscher in diesem Papier untersuchen: Gefälschte Bestellungen (Fake Orders), die sich in echte Nutzerdaten einschleichen.

Hier ist die einfache Erklärung der Lösung, die sie namens DITaR entwickelt haben, mit ein paar kreativen Vergleichen:

1. Das Problem: Der „verwirrte Koch"

Normalerweise lernt Ihr Koch-System aus echten Daten. Aber wenn gefälschte Daten dazukommen, lernt das System falsche Muster.

Das alte Problem: Bisherige Methoden waren wie ein grober Besen. Wenn sie verdächtige Daten fanden, haben sie einfach alles gelöscht und das System von vorne neu trainiert. Das ist extrem teuer, dauert ewig und wirft oft auch nützliche Informationen weg (wie wenn man einen ganzen Salatwegschmeißt, nur weil ein Blatt etwas welk ist).
Die neue Erkenntnis: Nicht jede gefälschte Bestellung ist böse! Manchmal kann eine kleine Störung sogar helfen, das System robuster zu machen (wie ein leichtes Training für einen Sportler). Das Problem ist also nicht das Vorhandensein von Störungen, sondern die schädlichen Störungen zu finden.

2. Die Lösung: DITaR – Der „Zwei-Augen-Inspektor"

Die Forscher nennen ihre Methode DITaR. Man kann sich das wie einen hochmodernen Sicherheitsdienst vorstellen, der zwei verschiedene Arten von Augen hat, um Betrug zu erkennen:

A. Die zwei Perspektiven (Dual-View)

Stellen Sie sich vor, ein Betrüger versucht, sich als echter Gast auszugeben.

Der „Sozial-Inspektor" (Kollaborative Sicht): Dieser sieht sich an, mit wem die Leute normalerweise zusammen essen. Wenn jemand plötzlich Dinge bestellt, die niemand sonst in dieser Gruppe bestellt, ist das verdächtig.
Der „Kultur-Inspektor" (Semantische Sicht): Dieser sieht sich an, was bestellt wird. Wenn jemand, der normalerweise nur Pizza isst, plötzlich eine Schüssel mit Schuhen bestellt (weil die Daten manipuliert wurden), passt das nicht in die Welt der Pizza.

Der Trick: Echte Kunden haben eine natürliche Übereinstimmung zwischen diesen beiden Perspektiven. Gefälschte Bestellungen schaffen es selten, in beiden Welten gleichzeitig glaubwürdig zu wirken. Sie hinterlassen eine Lücke oder einen Riss zwischen dem „Wer" und dem „Was". DITaR nutzt diese Lücke, um die Betrüger zu finden.

B. Der „Chirurgische Eingriff" (Targeted Rectification)

Sobald die verdächtigen Bestellungen gefunden sind, greift DITaR nicht mit einem Axt-Schlag an. Stattdessen nutzt es einen Chirurgischen Skalpell-Ansatz:

Die Prüfung: Bevor etwas entfernt wird, prüft das System: „Würde es dem System schaden, wenn wir diesen einen Datenpunkt löschen?"
Die Entscheidung:
- Wenn die Antwort „Ja, das schadet" ist (es ist ein böser Fake), wird dieser Punkt gezielt „herausoperiert".
- Wenn die Antwort „Nein, das hilft sogar" ist (es ist eine harmlose oder nützliche Störung), bleibt er drin.
Die Methode: Statt das ganze Restaurant neu zu bauen (Neu-Training), wird nur ein kleiner, präziser „Gegenstoß" (Gradient Ascent) ausgeführt, um den negativen Effekt der bösen Daten genau aufzuheben.

3. Das Ergebnis: Ein gesünderes System

Am Ende hat DITaR folgende Vorteile:

Schnelligkeit: Es muss nicht das ganze System neu lernen (kein „Neubau"), sondern repariert nur die beschädigten Stellen. Das spart enorm viel Zeit und Rechenleistung.
Präzision: Es entfernt nur das Gift, nicht die Medizin. Nützliche Informationen bleiben erhalten.
Vertrauen: Die Nutzer bekommen wieder genau das empfohlen, was sie wirklich mögen, und nicht das, was die Betrüger ihnen aufzwingen wollten.

Zusammenfassend:
Stellen Sie sich DITaR wie einen klugen Hausmeister vor, der nicht das ganze Haus abreißen muss, weil ein paar Schädlinge eingedrungen sind. Er nutzt zwei verschiedene Sensoren, um genau zu erkennen, welche Schädlinge wirklich gefährlich sind, und entfernt diese chirurgisch präzise, während er die nützlichen Bewohner (die echten Daten) schützt. So bleibt das Haus (das Empfehlungssystem) stabil, schnell und sicher.

Each language version is independently generated for its own context, not a direct translation.

Titel

Unbiased Rectification for Sequential Recommender Systems Under Fake Orders (Unvoreingenommene Bereinigung sequenzieller Empfehlungssysteme unter Fake-Orders)

1. Problemstellung

Sequenzielle Empfehlungssysteme modellieren historische Interaktionsverläufe von Nutzern, um zukünftige Präferenzen vorherzusagen. Diese Systeme sind zunehmend durch Fake-Orders bedroht. Im Gegensatz zu früheren Angriffen, bei denen gefälschte Benutzerkonten eingefügt wurden, um die Gesamtleistung zu verschlechtern, bestehen Fake-Orders aus manipulierten Interaktionen, die innerhalb echter Benutzersequenzen eingebettet sind.

Ziel der Angreifer: Durch gezielte Manipulation (z. B. Click-Farming, semantisch irrelevante Ersetzungen oder Störungen der zeitlichen Abfolge) werden spezifische Artikel bevorzugt exponiert, um Wettbewerbsvorteile zu erlangen.
Folgen: Dies verzerrt die echten Nutzerpräferenzen, führt zu fehlerhaften Empfehlungen und untergräbt das Vertrauen in das System.
Herausforderung: Herkömmliche Bereinigungsmethoden (Data Rectification) entfernen oft einfach alle verdächtigen Datenpunkte. Dies ist jedoch problematisch, da:
1. Nicht alle Fake-Orders schädlich sind (einige können sogar als Daten-Augmentation wirken).
2. Das einfache Löschen die Datenintegrität und Sequenzstruktur zerstört.
3. Das vollständige Neutraining der Modelle zu hohe Rechenkosten verursacht.

2. Methodik: DITaR (Dual-view Identification and Targeted Rectification)

Die Autoren schlagen DITaR vor, ein Framework, das eine präzise, unvoreingenommene Bereinigung ohne Neutraining ermöglicht. Der Ansatz besteht aus zwei Hauptphasen:

A. Dual-View Identification (DI) – Identifikation

Das Kernkonzept basiert auf der Erkenntnis, dass Fake-Orders Schwierigkeiten haben, Konsistenz über zwei verschiedene Perspektiven hinweg aufrechtzuerhalten:

Kollaborative Sicht (Collaborative View): Reflektiert statistische Muster von Nutzer-Item-Interaktionen.
Semantische Sicht (Semantic View): Erforscht intrinsische Assoziationen zwischen Artikeln (basierend auf Attributen und Text).

Architektur:
- Semantische Sicht: Artikelattribute werden in Prompts umgewandelt und durch ein vortrainiertes LLM (LLaMA2-7B) verarbeitet, um semantische Embeddings ( $E_s$ ) zu extrahieren.
- Kollaborative Sicht: Die semantischen Embeddings werden mittels PCA reduziert und mit lernbaren ID-Embeddings ( $E_i$ ) durch einen adaptiven Gate-Mechanismus fusioniert.
- Entkopplung: Separate sequenzielle Encoder generieren disjunkte Repräsentationen ( $R_s$ und $R_c$ ). Ein kontrastiver Lernverlust (InfoNCE Loss) erzwingt die Unabhängigkeit der beiden Ansichten.
Detektion: Fake-Orders erzeugen Inkonsistenzen zwischen diesen beiden Ansichten. Das System analysiert:
- Repräsentationsdiskrepanzen (Cosine Similarity).
- Vorhersagedivergenzen (Jensen-Shannon Divergenz).
- Intrinsische Anomalien (Populäritäts-Z-Scores und lokale Sequenzmuster).
- Diese Signale werden zu einem einheitlichen Anomalie-Score fusioniert, um verdächtige Interaktionen zu identifizieren.

B. Targeted Rectification (TaR) – Gezielte Bereinigung

Nicht alle identifizierten Fake-Orders sind schädlich. DITaR nutzt Influence Functions, um den tatsächlichen Einfluss einer Interaktion auf das Modell zu quantifizieren.

Filterung: Für jede verdächtige Interaktion $i_k$ $i_{k}$ wird berechnet, wie sich das Entfernen dieser Interaktion auf die Validierungsleistung auswirkt.
- Positiver Einfluss ( $Inf(i_k) > \tau$ ): Die Interaktion ist schädlich und wird zur Bereinigung markiert.
- Negativer/Null-Einfluss: Die Interaktion ist nützlich oder neutral und bleibt erhalten (Vermeidung von Datenverlust).
Bereinigung (Gradient Ascent): Anstatt die Daten zu löschen, wird ein zielgerichteter Gradienten-Anstieg auf den schädlichen Mustern durchgeführt, um deren negativen Einfluss auf die Modellparameter zu neutralisieren.
Regularisierung: Um die Fähigkeit des Modells für normale Aufgaben zu erhalten, wird nach jedem Update ein Schritt Gradientenabstieg auf sauberen Daten durchgeführt.

3. Wichtige Beiträge

Neues Szenario: Erstmalige Fokussierung auf das subtile Szenario von Fake-Orders, die in echte Benutzersequenzen eingebettet sind, anstatt gefälschte Benutzer zu injizieren.
Dual-View Framework: Ein neuartiger Ansatz, der Lücken zwischen semantischen und kollaborativen Repräsentationen nutzt, um manipulierte Daten präzise zu identifizieren.
Unvoreingenommene Bereinigung: Durch die Kombination von Influence Functions und Gradienten-Anstieg werden nur schädliche Samples bereinigt, während potenziell nützliche Informationen (Augmentationseffekte) erhalten bleiben. Dies vermeidet die Zerstörung der Datenintegrität.
Effizienz: Das Verfahren erfordert kein Neutraining und verändert nicht die Datenmenge oder -struktur, was es deutlich schneller macht als bestehende Methoden.

4. Ergebnisse

Die Methode wurde auf drei Datensätzen (MovieLens-1M, Amazon-Beauty, Yelp2018) und mit drei Basismodellen (SASRec, GRU4Rec, BERT4Rec) evaluiert.

Leistungsqualität: DITaR übertrifft State-of-the-Art-Baselines (wie SISA, RecEraser, UltraRE) in Bezug auf Hit Rate (HR) und NDCG signifikant. Die Leistung liegt nahe am Niveau des Originalmodells auf sauberen Daten und ist oft besser als das Ergebnis nach einem vollständigen Neutraining (da beim Neutraining Daten verloren gehen).
Recheneffizienz: DITaR benötigt deutlich weniger Konvergenz-Epochen (z. B. 5 Epochen im Vergleich zu 35–140 bei Baselines), da es nur eine Feinabstimmung (Fine-Tuning) durchführt und keine neuen Modelle von Grund auf trainiert.
Robustheit: Das System bleibt stabil unter verschiedenen Manipulationsintensitäten (30% und 60% der Nutzer betroffen).
Ablationsstudien:
- Die Entfernung einer der beiden Ansichten (kollaborativ oder semantisch) verschlechtert die Leistung, was die Notwendigkeit der Dual-View-Architektur unterstreicht.
- Ohne den Filter durch Influence Functions führt die direkte Bereinigung aller verdächtigen Daten zu Leistungsabfällen, da nützliche Daten fälschlicherweise entfernt werden.

5. Bedeutung und Fazit

Die Arbeit zeigt, dass Fake-Orders nicht pauschal als „schädlich" betrachtet werden dürfen; einige können sogar als Daten-Augmentation dienen. DITaR bietet einen effizienten Weg, um Empfehlungssysteme zu schützen, indem es präzise auf Sample-Ebene eingreift.

Praktische Relevanz: E-Commerce-Plattformen und Streaming-Dienste können DITaR nutzen, um Manipulationsversuche zu bekämpfen, ohne teure Neutraining-Prozesse durchzuführen oder die Nutzererfahrung durch den Verlust legitimer Daten zu verschlechtern.
Forschungsbeitrag: Das Paper etabliert einen neuen Standard für die Behandlung von Datenvergiftung in sequenziellen Empfehlungssystemen, indem es die Komplexität zeitlicher Abhängigkeiten und die Dualität von semantischen/kollaborativen Mustern berücksichtigt.

Zusammenfassend stellt DITaR einen Durchbruch dar, der Sicherheit, Effizienz und Genauigkeit in der Bekämpfung von Fake-Orders vereint.