LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

이 논문은 리뷰 텍스트와 상호작용 데이터를 통합하여 대규모 언어 모델 (LLM) 의 추론 능력을 활용하고 대비 학습을 통해 노이즈를 줄임으로써 추천 성능을 향상시키는 'LLM 기반 다중 모달 동기 인식 추천 시스템 (LMMRec)'을 제안합니다.

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 "사용자가 무엇을 선택하는지 (What)"뿐만 아니라, 왜 그걸 선택하는지 (Why) 를 이해하는 새로운 추천 시스템에 대해 이야기합니다.

기존의 추천 시스템이 마치 **"사용자가 클릭한 물건만 기록하는 단순한 계산기"**였다면, 이 논문에서 제안하는 **'LMMRec'**은 **"사용자의 마음속 깊은 욕망을 읽어내는 심리 상담사"**에 비유할 수 있습니다.

이 내용을 일상적인 언어와 비유로 쉽게 설명해 드릴게요.


1. 문제점: "무엇을 샀나?"만 아는 구식 시스템

지금까지의 추천 시스템은 사용자의 행동 기록 (클릭, 구매, 조회) 만을 보고 "아, 이 사람은 이걸 좋아했구나"라고 추측했습니다.

  • 비유: 친구가 매일 같은 커피를 사 먹는다고 해서, 그 친구가 '카페인 중독'인지, '아침에 깨어나기 위한 습관'인지, 아니면 '단순히 그 카페의 인테리어가 좋아서'인지 알 수 없는 것과 같습니다.
  • 한계: 시스템은 사용자의 **행동 (What)**만 보지, 그 이면에 있는 **심리적 동기 (Why)**를 놓치고 있었습니다. 특히 사용자가 남긴 리뷰나 검색어 같은 '말 (텍스트)' 속에 숨겨진 진짜 이유를 제대로 활용하지 못했습니다.

2. 해결책: LMMRec (거대 언어 모델이 이끄는 다중 모달 추천)

이 논문은 **거대 언어 모델 (LLM, 예: ChatGPT 같은 AI)**의 힘을 빌려, 사용자의 행동과 그들이 남긴 말 (리뷰, 검색어) 을 함께 분석하는 새로운 시스템을 만들었습니다.

  • 핵심 아이디어:
    • 행동 (Interaction): 사용자가 무엇을 클릭했는지.
    • 말 (Text): 사용자가 "이 제품은 내구성이 좋아서 산다"거나 "선물용으로 예쁜 게 필요하다"고 쓴 리뷰.
    • LMMRec 의 역할: 이 두 가지를 연결해서 **"사용자가 진짜 원하는 건 무엇인가?"**를 찾아냅니다.

3. 작동 원리: "심리 상담사"의 비유

이 시스템이 어떻게 작동하는지 세 가지 비유로 설명해 볼게요.

① 숨겨진 동기를 찾아내는 '탐정'

기존 시스템은 사용자의 발자국 (행동) 만 따라다녔다면, LMMRec 은 사용자의 **일기 (리뷰 텍스트)**까지 읽습니다.

  • 상황: 사용자가 '캠핑용 텐트'를 검색하고 샀다고 가정해 봅시다.
  • 기존 시스템: "아, 캠핑 용품을 좋아하네. 다른 캠핑 용품을 추천해 줘."
  • LMMRec (새 시스템): 리뷰를 보니 "비바람을 견딜 수 있는 튼튼한 게 필요해서 샀다"고 썼네요. "아, 이 사용자는 안전과 내구성을 최우선으로 생각하는구나."라고 파악합니다. 그래서 튼튼한 텐트나 방수 장비 등을 더 정확하게 추천해 줍니다.

② 언어와 행동을 연결하는 '번역기'

사용자의 행동 데이터 (숫자, 로그) 와 텍스트 데이터 (문장) 는 서로 다른 언어처럼 보였습니다. LMMRec 은 이 두 가지를 LLM 의 뛰어난 언어 이해 능력으로 연결합니다.

  • 비유: 마치 서로 다른 말을 하는 두 친구를 연결해 주는 통역사처럼, "사용자가 이 버튼을 누른 행동"과 "사용자가 쓴 '이게 정말 마음에 들어'라는 말"이 같은 마음에서 비롯되었음을 이해시켜 줍니다.

③ 소음 속에서도 진실을 찾는 '귀마개'

실제 데이터에는 엉뚱한 정보 (노이즈) 가 섞여 있을 수 있습니다. (예: 실수로 클릭한 것, 광고에 속은 것 등)

  • 실험 결과: 연구진은 인위적으로 엉뚱한 클릭 데이터를 30% 까지 섞어봤습니다.
  • 결과: 다른 시스템들은 엉뚱한 데이터에 혼란을 겪어 성능이 떨어졌지만, LMMRec 은 여전히 잘 작동했습니다.
  • 이유: LLM 이 텍스트의 진짜 의미를 이해하고 있기 때문에, 엉뚱한 행동 데이터에 속지 않고 사용자의 진짜 동기를 파악할 수 있었기 때문입니다.

4. 결론: 왜 이것이 중요한가?

이 시스템은 단순히 "무엇을 팔까?"를 고민하는 것을 넘어, **"사용자가 왜 그것을 원할까?"**를 깊이 있게 이해합니다.

  • 효과: 추천의 정확도가 약 5% 정도 향상되었고, 특히 사용자의 진짜 니즈 (욕구) 를 더 잘 파악할 수 있게 되었습니다.
  • 미래: 앞으로는 이 기술이 더 복잡한 상황에서도 사용자의 마음을 읽어내어, 우리가 원하지만 아직 모르고 있는 것들을 찾아주는 **'예리한 추천 비서'**가 될 것입니다.

한 줄 요약:

**"사용자가 클릭한 행동만 보는 게 아니라, 그들이 남긴 말 (리뷰) 을 거대 AI 가 분석해서 사용자의 진짜 마음 (동기) 을 찾아내고, 그걸로 더 정확한 추천을 해주는 똑똑한 시스템"**입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →