Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

이 논문은 중첩된 사용자나 아이템이 없는 환경에서도 소스 도메인의 지식을 효과적으로 전이하여 데이터 희소성과 콜드 스타트 문제를 해결하기 위해, 사용자의 선호도를 가우시안 혼합 모델로 표현하고 최적 수송을 기반으로 정렬하는 새로운 프레임워크인 DUP-OT 를 제안합니다.

Ziyin Xiao, Toyotaro Suzumura

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎬 비유: "낯선 도시의 맛집 찾기"

상상해 보세요. 당신은 **A 도시 (소스 도메인)**에서 맛집을 찾아다니는 전문가입니다. 하지만 이제 **B 도시 (타겟 도메인)**로 이사를 갔는데, B 도시에는 A 도시와 아무런 공통점이 없습니다.

  • A 도시의 친구들이 B 도시에도 없습니다. (사용자 겹침 없음)
  • A 도시의 식당 이름이 B 도시에도 없습니다. (아이템 겹침 없음)

기존의 추천 시스템들은 "A 도시의 친구가 B 도시의 이 식당을 좋아했으니, 당신도 좋아할 거야"라고 말하며 추천을 했습니다. 하지만 친구나 식당 이름이 아예 없으면 이 시스템은 완전히 멈춰버립니다.

이 논문 (DUP-OT) 은 이런 상황에서도 "너의 취향을 분석해서 B 도시의 맛집을 찾아줄게!"라고 말합니다. 어떻게 할까요?

1. 핵심 아이디어: "취향은 점 (Vector) 이 아니라 구름 (Distribution) 이다"

기존 시스템은 사용자의 취향을 **"고정된 점"**으로 보았습니다.

  • 예: "이 사람은 '액션' 70%, '코미디' 30% 를 좋아해."
  • 문제: 사람은 상황에 따라 취향이 변할 수 있고, 한 가지 장르만 좋아하는 게 아닙니다.

이 논문은 취향을 **"구름 (확률 분포)"**으로 봅니다.

  • *예: "이 사람은 '액션' 구름이 두껍고, '코미디' 구름도 살짝 있는, 복합적인 구름 모양을 하고 있어."*
  • **GMM(가우시안 혼합 모델)**이라는 수학적 도구를 써서, 사용자의 취향을 여러 개의 작은 구름들이 모여 만든 복잡한 모양으로 표현합니다. 이렇게 하면 사용자의 다채로운 취향을 훨씬 정교하게 잡을 수 있습니다.

2. 두 세계를 연결하는 다리: "최적 수송 (Optimal Transport)"

이제 A 도시의 '취향 구름'을 B 도시로 어떻게 옮길까요? 두 도시에 공통된 친구가 없으니 직접 비교할 수 없습니다.

여기서 **'최적 수송 (Optimal Transport)'**이라는 개념이 등장합니다.

  • 비유: A 도시의 '맛집 지도'와 B 도시의 '맛집 지도'가 완전히 다르다고 칩시다. 하지만 두 지도를 비교했을 때, "A 도시의 '매운맛' 구름과 B 도시의 '매운맛' 구름은 서로 가장 가깝게 이동해야 해"라고 계산하는 것입니다.
  • 이 기술은 공통된 사람이나 물건이 없어도, 두 도메인의 '취향 구조' 자체를 수학적으로 가장 효율적으로 맞춰줍니다. 마치 서로 다른 언어를 쓰는 두 사람이 손짓과 표정으로 서로의 감정을 완벽하게 이해하는 것과 비슷합니다.

3. DUP-OT 의 작동 방식 (3 단계)

  1. 준비 단계 (공통 언어 만들기):
    두 도시의 리뷰 텍스트를 읽고, AI 가 공통된 언어 (임베딩) 로 번역합니다. "맛있다", "재미있다" 같은 표현을 두 도시 모두에서 통하는 의미로 통일합니다.

  2. 취향 분석 단계 (구름 그리기):
    각 도시에서 사용자들이 어떤 '취향 구름'을 가지고 있는지 분석합니다. 이때, A 도시의 '액션 구름'과 B 도시의 '액션 구름'이 서로 대응된다는 것을 미리 학습합니다.

  3. 이동 및 예측 단계 (가장자리로 이동):
    A 도시의 사용자를 B 도시로 보낼 때, 그의 '취향 구름'을 최적 수송을 이용해 B 도시의 공간에 맞춰 이동시킵니다. 그리고 B 도시의 새로운 식당 (아이템) 에 대해 "이 구름 모양의 사람이 이 식당을 얼마나 좋아할까?"를 예측합니다.

🏆 왜 이 방법이 특별한가요? (결과)

실험 결과, 이 방법은 **새로운 도시 (B 도시) 에 갓 도착한 사람 (콜드 스타트 사용자)**에게 특히 강력했습니다.

  • 기존 방법 (TDAR 등): 큰 실수를 할 확률이 높았습니다. (예: 아주 싫어할 음식을 강추하는 등)
  • 이 방법 (DUP-OT): "큰 실수"를 막아주었습니다. RMSE(오차의 제곱 평균) 가 낮았다는 것은, 사용자가 가장 싫어할 만한 추천을 피해서, 실패 확률을 줄였다는 뜻입니다.

💡 한 줄 요약

"서로 다른 두 세계에 공통된 사람이 없어도, 사용자의 취향을 '고정된 점'이 아닌 '유연한 구름'으로 표현하고, 수학적으로 두 세계의 구름을 가장 잘 맞춰주는 기술로, 새로운 환경에서도 실패 없는 추천을 가능하게 합니다."

이 기술은 우리가 새로운 앱이나 서비스를 처음 사용할 때, 아직 데이터를 많이 남기지 않았더라도 더 똑똑하고 안전한 추천을 받을 수 있게 해줄 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →