Debiasing Sequential Recommendation with Time-aware Inverse Propensity Scoring

Deze paper introduceert Time-aware Inverse Propensity Scoring (TIPS), een methode die bestaande sequentiële aanbevelingsmodellen verbetert door selectie- en blootstellingsbias effectief aan te pakken via het modelleren van tijdsafhankelijke dynamiek en tegenstellige redenering.

Sirui Huang, Jing Long, Qian Li, Guandong Xu, Qing Li

Gepubliceerd 2026-03-06
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

🎬 De Filmtheater-Verwachting: Waarom je soms de verkeerde films krijgt

Stel je voor dat je naar een groot filmtheater gaat. De verkoper (het recommender-systeem) kijkt naar wat je in het verleden hebt gekocht of bekeken om je de volgende film te adviseren.

Het probleem is echter dat de verkoper niet ziet wat je niet hebt gezien.

  • Als je een film koopt, denkt de verkoper: "Ah, deze persoon houdt van deze film!"
  • Maar als de verkoper een film aanbiedt en jij hem niet koopt, denkt de verkoper: "Deze persoon houdt niet van deze film."
  • Het ergste is: als de verkoper een film nooit aan je aanbiedt (bijvoorbeeld omdat hij in de schappen ligt), denkt de verkoper: "Deze persoon heeft er geen interesse in."

Dit is wat de auteurs selectiebias en exposure bias noemen. Het systeem leert alleen van wat er gebeurt, niet van wat er had kunnen gebeuren.

⏳ Het Probleem met de "Statische" Oplossing

Vroeger probeerden onderzoekers dit op te lossen met een techniek genaamd IPS (Inverse Propensity Scoring).

  • De analogie: Stel je voor dat je een weegschaal gebruikt. Als een film zelden wordt aangeboden, geef je die film een zwaar gewicht op de schaal, zodat hij telt als "belangrijk".
  • Het nadeel: Deze oude weegschaal is statisch. Hij kijkt niet naar de tijd. Hij ziet niet dat je gisteren van actiefilms hield, maar vandaag van romantische komedies. Hij ziet ook niet dat een film gisteren populair was, maar vandaag vergeten is. Het is alsof je probeert de smaak van een mens te voorspellen met een foto van 10 jaar geleden.

🚀 De Nieuwe Oplossing: HyperG (TIPS)

De auteurs van dit paper hebben een slimme nieuwe methode bedacht, genaamd HyperG (of TIPS: Time-aware Inverse Propensity Scoring). Ze vergelijken dit met het hebben van een tijdmachine en een dromenwereld.

Hier is hoe het werkt, stap voor stap:

1. De Dromenwereld (Counterfactual Reasoning)

Omdat we niet weten welke films er niet werden aangeboden, moeten we het uitvinden.

  • De analogie: De computer stelt zich vragen als: "Wat als ik deze persoon een heel populaire film had laten zien, maar hij had hem niet gekocht?" of "Wat als ik deze persoon een film had laten zien die lijkt op wat hij eerder kocht?"
  • Door deze "wat-als" scenario's te simuleren, kan het systeem leren wat je echt leuk vindt, zelfs als je die specifieke film nooit hebt gezien. Het vult de gaten in je geschiedenis op.

2. De Tijdmachine (Time-awareness)

De oude methode keek alleen naar wat je deed. HyperG kijkt ook naar wanneer je het deed.

  • De analogie: Stel je voor dat je gisteren een pizza at. Vandaag heb je misschien zin in sushi. Als je systeem niet naar de tijd kijkt, blijft het je pizza aanraden.
  • HyperG weet dat je interesses veranderen. Een item dat gisteren populair was, is vandaag misschien saai. De methode past de "weegschaal" (de propensiteit) dynamisch aan, afhankelijk van hoe recent je interactie was.

3. Twee verschillende geheugens (Dual Encoding)

Het systeem heeft twee soorten geheugen nodig:

  1. Wat je kocht: (Interactie)
  2. Wat je zag: (Exposure)
  • De analogie: Stel je voor dat je een lijst maakt van "Films die ik heb gezien" en een lijst van "Films die ik heb gekocht". Als je alleen naar de "gekochte" lijst kijkt, mis je de films die je zag maar niet kocht. HyperG houdt beide lijsten gescheiden, zodat het systeem niet verward raakt en precies weet wat er aan de hand is.

🏆 Wat levert dit op?

De auteurs hebben hun nieuwe methode getest op enorme databases met film- en muziekdata (zoals MovieLens en Music4All).

  • Het resultaat: Door de "tijdmachine" en de "dromenwereld" te gebruiken, krijgen gebruikers veel betere suggesties.
  • Vergelijking: Het is alsof je een oude, stijve robot vervangt door een slimme assistent die onthoudt: "Ah, de heer Jansen kocht gisteren een horrorfilm, maar hij is vandaag moe, dus ik raad hem een komedie aan, en ik geef die komedie extra punten omdat hij die film vaak ziet, maar nog nooit heeft gekocht."

Samenvattend in één zin:

Dit paper introduceert een slimme manier om aan te raden wat je wilt, door niet alleen te kijken naar wat je hebt geklikt, maar ook door te simuleren wat je had geklikt als je meer keuzes had gehad, en daarbij rekening te houden met het feit dat je smaak verandert naarmate de tijd verstrijkt.