Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous êtes un chef cuisinier (le système de recommandation) qui essaie de prédire ce qu'un client va aimer manger.

1. Le Problème : Le Client Mystère et les Recettes Oubliées

Dans le monde réel, les sites de vente en ligne (comme Amazon) ont deux gros problèmes :

Le "Froid" (Cold Start) : De nouveaux clients arrivent tous les jours. Ils n'ont encore rien acheté, donc le chef ne sait pas ce qu'ils aiment. C'est comme essayer de deviner le plat préféré d'un inconnu sans jamais l'avoir vu manger.
La Barrière des Langues (Non-Overlapping) : Souvent, le chef a un restaurant de Pizzas (Domaine Source, plein de données) et un restaurant de Sushi (Domaine Cible, vide de données). Le problème ? Les clients qui mangent des pizzas ne sont pas les mêmes que ceux qui mangent du sushi, et les menus sont différents. Traditionnellement, les systèmes disent : "On ne peut pas aider le restaurant de Sushi car on ne connaît aucun de ses clients". C'est comme si le chef refusait d'utiliser ses compétences en cuisine italienne pour aider à cuisiner japonais.

2. L'Ancienne Méthode : Une Photo Floue

Les anciennes méthodes essayaient de résoudre ce problème en regardant les clients comme des photos fixes (des vecteurs discrets).

L'analogie : Imaginez que vous décrivez un client par une seule étiquette collée sur son front : "Aime le sucré". C'est trop simple ! Un client peut aimer le sucré le matin, le salé le midi et l'épicé le soir. Une seule étiquette ne capture pas toute la complexité de ses goûts.

3. La Solution DUP-OT : Le Nuage de Saveurs et le Pont Magique

Les auteurs proposent une nouvelle méthode appelée DUP-OT. Voici comment elle fonctionne, étape par étape, avec des images simples :

Étape A : Le Nuage de Goûts (GMM - Gaussian Mixture Model)

Au lieu de coller une seule étiquette sur le client, DUP-OT imagine les goûts de chaque personne comme un nuage de saveurs.

L'analogie : Imaginez que les goûts d'un client ne sont pas un point unique, mais un nuage de couleurs dans l'espace. Ce nuage a plusieurs "bouts" (des composantes).
- Un bout du nuage est rouge (aime les films d'action).
- Un bout est bleu (aime les comédies romantiques).
- Un bout est vert (aime les documentaires).
- La taille de chaque couleur représente à quel point le client aime ce genre.
  Cela permet de dire : "Ce client aime un peu de tout, mais surtout l'action et un peu de romance". C'est beaucoup plus précis qu'une simple étiquette.

Étape B : Le Pont Magique (Optimal Transport)

Maintenant, comment transférer ces connaissances du restaurant de Pizzas vers celui de Sushi sans que les clients ne se connaissent ?

L'analogie : C'est là que le Transport Optimal intervient. Imaginez que vous avez deux nuages de couleurs (un pour les clients Pizza, un pour les clients Sushi). Le système utilise une "balance magique" pour trouver la meilleure façon de déplacer les couleurs du nuage Pizza vers le nuage Sushi.
- Il ne transfère pas les clients eux-mêmes (car ils sont différents), mais il transfère la structure de leurs goûts.
- Il dit : "Les clients qui aiment les pizzas avec beaucoup de fromage correspondent probablement aux clients sushi qui aiment le poisson gras".
- C'est comme si le chef disait : "Je sais que les gens qui aiment les fromages forts adorent aussi les fromages de chèvre, même si je n'ai jamais vu ces clients manger du fromage de chèvre".

Étape C : La Fusion

Une fois le pont construit, le système prend le "nuage de goûts" appris sur les clients Pizzas et le fusionne avec les quelques informations qu'il a sur les nouveaux clients Sushi.

Si un client n'a rien fait sur le site de Sushi, le système lui attribue le "nuage" adapté venant du domaine Pizza.
Résultat : Le chef peut maintenant prédire avec beaucoup plus de précision ce que ce nouveau client va aimer, même s'il est un inconnu total.

4. Pourquoi c'est génial ? (Les Résultats)

Les auteurs ont testé leur méthode sur de vraies données (Amazon).

Sans données sources : Même sans utiliser les données des Pizzas, leur méthode (le nuage de goûts) fonctionne mieux que les anciennes méthodes (la photo fixe) pour prédire les notes.
Avec données sources : Quand ils utilisent le "pont magique", ils font encore mieux.
Le plus important : Ils réduisent énormément les grossières erreurs. Pour les nouveaux clients (ceux qui ont froid), les anciens systèmes pouvaient dire "Ce client va adorer ce film d'horreur" alors qu'il déteste ça. DUP-OT, grâce à son approche nuageuse, évite ces catastrophes et reste prudent et précis.

En Résumé

DUP-OT, c'est comme passer d'une carte d'identité rigide à un portrait-robot dynamique et nuancé pour chaque client. En utilisant une "balance magique" (Optimal Transport) pour transférer les nuances de goûts d'un domaine à l'autre, le système devient capable de deviner ce qu'aiment les nouveaux arrivants, même s'ils n'ont jamais laissé de trace, résolvant ainsi le mystère du "client froid".

Each language version is independently generated for its own context, not a direct translation.

Titre

Modélisation des préférences utilisateurs sous forme de distributions pour la recommandation trans-domaine optimale basée sur le transport optimal dans des contextes sans chevauchement.

1. Problématique

Les systèmes de recommandation trans-domaine (CDR) visent à transférer les connaissances d'un domaine riche en données (source) vers un domaine pauvre (cible) pour résoudre les problèmes de sparsité des données et de démarrage à froid (cold-start). Cependant, les approches existantes souffrent de deux limitations majeures :

Dépendance aux entités chevauchantes : La plupart des méthodes nécessitent des utilisateurs ou des articles communs entre les domaines pour établir des liens explicites, ce qui est irréaliste dans de nombreux scénarios réels (contraintes de confidentialité, systèmes hétérogènes).
Représentation rigide des préférences : Les méthodes actuelles modélisent les préférences utilisateurs comme des vecteurs discrets fixes. Cette approche limite la capacité à capturer la nature multi-aspect et fine des intérêts d'un utilisateur, qui peuvent varier selon le contexte ou le type d'article.

L'objectif de cet article est de proposer un cadre de CDR fonctionnant dans un scénario strictement sans chevauchement (aucun utilisateur ni article partagé durant l'entraînement) tout en adoptant une modélisation probabiliste des préférences.

2. Méthodologie : DUP-OT

Les auteurs proposent DUP-OT (Distributional User Preferences with Optimal Transport), un cadre novateur composé de trois étapes principales :

A. Prétraitement Partagé (Shared Preprocessing)

Encodage Sémantique : Utilisation d'un encodeur de phrases pré-entraîné (unifié) pour transformer les textes d'avis (reviews) en embeddings initiaux pour les utilisateurs et les articles. Un schéma de pondération temporelle est appliqué pour donner plus d'importance aux avis récents.
Réduction de Dimensionnalité : Un auto-encodeur partagé est entraîné sur les deux domaines pour obtenir des embeddings compacts et cohérents, assurant un espace latent unifié nécessaire pour la modélisation ultérieure.

B. Modélisation des Préférences Utilisateurs (GMM)

Au lieu de vecteurs fixes, chaque utilisateur est représenté par un Modèle de Mélange Gaussien (GMM) sur les embeddings des articles.

Composantes Partagées : Pour réduire la complexité computationnelle, tous les utilisateurs d'un domaine partagent un ensemble de composantes gaussiennes (centres et covariances) extraites des embeddings des articles via l'algorithme EM.
Poids Personnalisés : Chaque utilisateur apprend un ensemble de poids de mélange personnalisés sur ces composantes partagées via un réseau de neurones (MLP). Cela permet de capturer des préférences multi-aspects.
Prédiction : Un autre MLP prédit la note en fonction de la distance de Mahalanobis pondérée entre l'embedding de l'article et les composantes gaussiennes de l'utilisateur.

C. Alignement par Transport Optimal (OT)

Pour transférer les connaissances sans utilisateurs communs, le cadre utilise le Transport Optimal (OT) pour aligner les distributions entre les domaines source et cible.

Alignement des Composantes : Au lieu d'aligner les utilisateurs individuellement (coûteux), l'OT aligne les ensembles de composantes gaussiennes des deux domaines. La matrice de coût est calculée via la distance de Wasserstein-2 ( $W_2$ ) entre les distributions gaussiennes.
Transfert des Poids : Une fois la matrice de transport optimale $T$ calculée, les poids des mélanges des utilisateurs du domaine source sont transférés vers le domaine cible ( $w^t = w^s T$ ).
Fusion pour la Prédiction : Pour un utilisateur cible, la distribution finale est une fusion linéaire de la distribution originale (si des données existent) et de la distribution transférée, permettant d'améliorer la prédiction même pour les utilisateurs sans historique dans le domaine cible.

3. Contributions Clés

Modélisation Distributionnelle : Introduction d'une approche modélisant les préférences utilisateurs via des GMMs plutôt que des vecteurs discrets, offrant une représentation plus riche et expressive.
Cadre Sans Chevauchement : Développement d'un mécanisme de transfert efficace basé sur le Transport Optimal qui ne nécessite aucune entité partagée (utilisateurs ou articles) durant l'entraînement, résolvant un problème pratique majeur.
Efficacité Computationnelle : Proposition d'une architecture où l'alignement se fait au niveau des composantes gaussiennes (domaine) et non des utilisateurs, rendant le transport optimal faisable à grande échelle.

4. Résultats Expérimentaux

Les expériences ont été menées sur des jeux de données Amazon Review (5-core), utilisant "Electronics" comme domaine cible et d'autres domaines (Musique, Films, Jeux Vidéo) comme sources.

Performance Globale : DUP-OT surpasse les modèles de recommandation mono-domaine (LightGCN, NeuMF) même sans utiliser de données du domaine source (grâce à la modélisation GMM seule).
Comparaison avec l'État de l'Art (TDAR) : Dans des conditions strictement sans chevauchement, DUP-OT obtient une RMSE (Root Mean Square Error) inférieure à celle du modèle de référence TDAR.
Impact sur le Démarrage à Froid : La réduction de la RMSE indique que DUP-OT est particulièrement efficace pour réduire les grosses erreurs de prédiction pour les utilisateurs en démarrage à froid.
- Note : Bien que la MAE (Mean Absolute Error) soit parfois légèrement supérieure à TDAR, la RMSE plus faible suggère que DUP-OT évite mieux les prédictions extrêmes et catastrophiques, ce qui est crucial pour les utilisateurs avec peu d'interactions.

5. Signification et Conclusion

Ce travail démontre que la modélisation des préférences sous forme de distributions (GMM) combinée au Transport Optimal est une voie prometteuse pour la recommandation trans-domaine.

Robustesse : La méthode offre une robustesse supérieure face aux données éparses et aux utilisateurs nouveaux.
Praticité : Elle élimine la barrière de la nécessité d'avoir des utilisateurs communs, rendant le CDR applicable à des scénarios réels où les identités sont masquées ou non synchronisées.
Perspectives : Les auteurs suggèrent des travaux futurs pour optimiser la fusion des distributions (au lieu d'une fusion linéaire fixe) et étendre le cadre aux feedbacks implicites.

En résumé, DUP-OT établit un nouvel état de l'art pour les scénarios de recommandation trans-domaine stricts, prouvant que l'approche distributionnelle surpasser les approches vectorielles traditionnelles, même en l'absence de données de chevauchement.