Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

Dit paper introduceert DUP-OT, een nieuw raamwerk voor cross-domein aanbeveling dat gebruikersvoorkeuren modelleert als verdelingen en optimale transport gebruikt om effectieve kennisoverdracht mogelijk te maken in scenario's zonder overlappende gebruikers of items.

Ziyin Xiao, Toyotaro Suzumura

Gepubliceerd 2026-03-03
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een reistips-expert bent. Je hebt jarenlang boeken gelezen over reizen in Japan (de "bron-domein"). Je weet precies welke restaurants, hotels en bezienswaardigheden populair zijn, en je kunt de smaken van Japanse reizigers heel goed voorspellen.

Nu krijg je een nieuwe opdracht: je moet tips geven voor een reis naar Brazilië (de "doel-domein"). Maar er is een groot probleem:

  1. Je hebt geen contact met de Braziliaanse reizigers die je moet adviseren (ze zijn "niet-overlappend").
  2. Je hebt weinig data over Brazilië; er zijn maar een paar recensies beschikbaar.
  3. De meeste andere experts proberen hun advies te geven door te zeggen: "Ik ken iemand die in beide landen is geweest, dus ik weet wat hij leuk vindt." Maar dat werkt niet als je die mensen niet kent.

De meeste bestaande systemen proberen je voorkeur te beschrijven als een vast lijstje (een vector): "Ik hou van zee, ik hou van bergen, ik hou van sushi." Dit is te simpel. Mensen zijn complex: soms wil je een avontuurlijke wandeling, soms wil je gewoon op een terras zitten. Een vast lijstje kan die nuance niet vangen.

De Oplossing: DUP-OT (De "Smaken-Mix")

De auteurs van dit paper, Ziyin Xiao en Toyotaro Suzumura, hebben een slimme nieuwe methode bedacht genaamd DUP-OT. Laten we het uitleggen met een paar creatieve vergelijkingen:

1. Van Vaste Lijstjes naar "Wolkjes van Smaken" (GMM)

In plaats van te zeggen "Ik hou van sushi", beschrijft DUP-OT een gebruiker als een wolk van smaken.

  • Stel je voor: Een gebruiker is geen enkel punt op een kaart, maar een wolk die bestaat uit verschillende kleuren.
  • De ene kleur staat voor "luxe hotels", een andere voor "strandfeesten", en weer een andere voor "historische musea".
  • Bij deze methode (Gaussian Mixture Model) weet het systeem niet alleen wat je leuk vindt, maar ook hoe sterk je die voorkeur hebt en hoeveel verschillende kanten je persoonlijkheid heeft. Het is alsof je niet zegt "Ik hou van Italiaans eten", maar "Ik ben 40% dol op pizza, 30% op pasta en 30% op gelato".

2. De "Vervoers-Logistiek" (Optimal Transport)

Nu komt het moeilijke deel: hoe vertaal je je kennis van Japan naar Brazilië als je geen gemeenschappelijke mensen kent?

  • Stel je voor dat je in Japan een pakket met smaken hebt (de wolkjes van de Japanse reizigers).
  • In Brazilië heb je een lege doos met lege plekken voor smaken.
  • De methode gebruikt Optimal Transport (een wiskundige manier om kosten te minimaliseren bij het verplaatsen van dingen). Het is alsof je een logistiek expert bent die kijkt: "Welke kleur uit de Japanse wolk past het beste bij welke plek in de Braziliaanse doos?"
  • Misschien is de "luxe-hotel" kleur uit Japan heel vergelijkbaar met de "luxe-hotel" kleur in Brazilië, ook al zijn de mensen anders. De methode "verplaatst" de kennis van de ene wolk naar de andere, zodat de Braziliaanse reizigers profiteren van de Japanse ervaringen, zonder dat ze elkaar ooit hebben ontmoet.

3. Drie Stappen in het Proces

Het systeem werkt in drie duidelijke fases:

  1. De Vertaler (Preprocessing): Het systeem leest alle recensies (tekst) en maakt er een simpele, samengevatte samenvatting van. Het is alsof je een heel dik boek in één pagina samenvat die voor beide landen begrijpelijk is.
  2. De Smaken-Maker (GMM Learning): Het systeem bouwt die "wolkjes van smaken" voor elke gebruiker. Het leert: "Ah, deze gebruiker is een mix van avonturier en rustzoeker."
  3. De Verhuizer (Alignment): Het systeem gebruikt de logistiek (Optimal Transport) om de smaken van de Japanse gebruikers te "verhuren" aan de Brazilische gebruikers. Als een Braziliaanse gebruiker nog geen recensies heeft (een koude start), krijgt hij direct een slimme voorspelling gebaseerd op de Japanse ervaringen.

Waarom is dit zo goed?

In de tests met echte Amazon-gegevens (zoals muziek, films en elektronica) bleek dit systeem te werken:

  • Beter dan alleen Brazilië: Zelfs zonder de Japanse data was het systeem al beter dan traditionele methoden, omdat het de complexe "wolkjes" van smaken beter begreep dan simpele lijsten.
  • Beter dan andere experts: Het was zelfs beter dan de beste bestaande methoden (zoals TDAR) om grote fouten te voorkomen.
    • Vergelijking: Stel je voor dat een ander systeem zegt: "Deze nieuwe gebruiker zal een 10 geven" (terwijl hij een 2 zou geven). Dat is een enorme fout. DUP-OT is conservatiever en zegt: "Deze gebruiker is een mix, dus waarschijnlijk een 5 of 6." Het voorkomt dat je een gebruiker volledig verkeerd inschat, wat cruciaal is voor mensen die nog geen ervaring hebben (cold-start).

Conclusie

DUP-OT is als een slimme vertaler die niet alleen woorden vertaalt, maar ook culturele smaken overbrengt. Het begrijpt dat mensen complex zijn (geen vaste lijsten) en weet hoe je kennis overbrengt naar een nieuwe wereld, zelfs als je de mensen daar nog niet kent. Hierdoor krijgen nieuwe gebruikers veel betere aanbevelingen, zonder dat ze eerst jarenlang hoeven te klikken en beoordelen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →