MMQ: Multimodal Mixture-of-Quantization Tokenization for Semantic ID Generation and User Behavioral Adaptation

이 논문은 대규모 및 희소 아이템 코퍼라에서 확장성과 일반화 문제를 해결하기 위해, 멀티모달 시너지와 특이성을 동시에 포착하고 사용자 행동에 적응하는 새로운 '멀티모달 혼합 양자화 (MMQ)' 토크나이저를 제안하여 추천 시스템의 성능을 향상시키는 두 단계 프레임워크를 제시합니다.

Yi Xu, Moyu Zhang, Chenxuan Li, Zhihao Liao, Haibo Xing, Hao Deng, Jinxin Hu, Yu Zhang, Xiaoyi Zeng, Jing Zhang

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧐 기존 방식의 문제점: "고유 번호만 외우는 비효율"

예전 추천 시스템은 각 상품 (옷, 신발 등) 에 **고유 번호 (Item ID)**를 붙여 관리했습니다. 마치 옷장에 옷을 넣을 때, "이 옷은 1 번, 저 옷은 2 번"이라고 번호만 외우는 방식이죠.

하지만 이 방식에는 두 가지 큰 문제가 있었습니다.

  1. 새로운 옷이 들어오면 당황: 새로운 옷이 들어오면 번호를 새로 배정해야 하고, 그 옷에 대한 데이터가 없으면 추천을 못 합니다. (장기적인 옷장 정리 실패)
  2. 비슷한 옷을 구분 못 함: "여름용 민소매"와 "여름용 반바지"는 스타일이 비슷하지만, 번호가 다르면 서로 관련이 없다고 착각합니다.

💡 새로운 해결책: "의미 있는 태그 (Semantic ID)"

연구자들은 "번호 대신 의미 있는 태그를 붙이자"고 생각했습니다.
예를 들어, "여름", "패션", "휴양지" 같은 단어로 옷을 분류하는 거죠. 이렇게 하면 새로운 옷이 들어와도 "아, 이건 '여름' 태그가 있구나!"라고 바로 추천할 수 있습니다.

하지만 여기서 또 두 가지 난관이 생겼습니다.

  1. 이미지와 글자의 조화: 옷을 설명할 때 '사진'과 '글자 설명'이 서로 다른 정보를 줍니다. 둘을 섞으면 좋은 정보가 섞여 나오지만, 너무 섞이면 옷의 고유한 특징 (예: 특정 브랜드 로고) 이 사라질 수 있습니다.
  2. 이론과 현실의 괴리: "이 옷은 '여름' 태그가 있으니 여름에 잘 팔리겠지?"라고 생각했는데, 실제로는 사람들이 '여름' 태그가 있는 옷을 안 사고 '겨울'에 사기도 합니다. (사용자 행동과 의미의 불일치)

🚀 MMQ 의 등장: "초능력 스타일리스트"

이 모든 문제를 해결하기 위해 MMQ라는 새로운 시스템을 개발했습니다. 이를 세 단계로 나누어 설명해 볼게요.

1 단계: "전문가 팀 구성하기" (다중 전문가 아키텍처)

이 시스템은 옷을 분석할 때 두 종류의 전문가를 동시에 고용합니다.

  • 공통 전문가 (Shared Experts): "여름", "패션"처럼 옷과 옷 사이에서 공통적으로 나타나는 특징을 찾아냅니다. (예: "두 옷 다 여름용이네!")
  • 전용 전문가 (Specific Experts): "이 옷은 청바지 특유의 질감이 있네", "저 옷은 특정 브랜드 로고가 있네"처럼 각 옷만의 고유한 특징을 잡아냅니다.

이 두 팀이 서로 간섭하지 않고 (직교 정규화) 일하게 해서, 공통점과 고유점을 모두 놓치지 않게 합니다. 마치 패션 디자이너세부 수선 전문가가 팀을 이뤄 옷을 완벽하게 분석하는 것과 같습니다.

2 단계: "실제 고객 취향에 맞춰 다듬기" (행동 인식 미세 조정)

이제 분석된 태그들이 실제 고객들이 무엇을 좋아하는지와 맞아야 합니다.
기존 방식은 "태그를 붙이면 끝"이었지만, MMQ 는 **"실제 구매 기록을 보고 태그를 수정"**합니다.

  • 예: "여름" 태그가 붙은 옷인데, 실제로는 겨울에 많이 팔렸다면? 시스템이 "아, 이 옷은 '여름'보다는 '실내 활동' 태그가 더 적합하구나"라고 스스로 학습합니다.
  • 이때 사진이나 글자 정보가 사라지지 않도록 보호막을 치고, 오직 구매 행동만 반영되도록 조정합니다.

🌟 왜 이것이 중요한가요? (결과)

이 시스템을 실제 알리바바의 쇼핑몰에 적용해 보니 놀라운 결과가 나왔습니다.

  • 장기적인 옷 (Long-tail) 추천: 잘 팔리지 않던 옷이나 새로 나온 옷도, 비슷한 스타일의 옷 데이터를 바탕으로 정확하게 추천해 줍니다.
  • 실제 매출 증가: 온라인 실험에서 광고 수익이 0.9%, **구매 전환율 (CVR) 이 4.33%**나 늘어났습니다. 이는 수백만 원, 수천만 원의 추가 수익으로 이어집니다.

📝 한 줄 요약

MMQ는 옷을 단순히 번호로 관리하던 구식 방식을 버리고, **사진과 글자의 특징을 모두 파악하는 '전문가 팀'**을 꾸려 옷을 분석한 뒤, 실제 고객의 구매 습관을 반영해 태그를 최종 수정하는 똑똑한 추천 시스템입니다.

이 기술 덕분에 우리는 더 이상 "이 옷은 번호가 1234 번이라서 추천받지 못했네"라는 불평을 하지 않아도 되며, 내 취향에 딱 맞는 옷을 더 정확하게 찾아낼 수 있게 된 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →