Causal Direct Preference Optimization for Distributionally Robust Generative Recommendation

이 논문은 환경적 교란 변수로 인한 허위 상관관계를 완화하고 분포 외 (OOD) 상황에서의 일반화 성능을 향상시키기 위해 인과 불변 학습 메커니즘을 통합한 'CausalDPO'를 제안하고, 이를 통해 기존 직접 선호도 최적화 (DPO) 의 한계를 극복하고 추천 모델의 강건성을 입증합니다.

Chu Zhao, Enneng Yang, Jianzhe Zhao, Guibing Guo

게시일 2026-03-25
📖 1 분 읽기☕ 가벼운 읽기

이 언어로는 아직 설명이 없습니다.

다른 언어: DE, EN, ES, FR, IT, JA, KO, NL, PT, ZH