Each language version is independently generated for its own context, not a direct translation.
🌙 MOON: 쇼핑몰의 '초능력을 가진 쇼핑 도우미'
1. 기존 방식의 문제점: "혼자서 일하는 두 명의 직원"
기존의 상품 이해 기술은 **'이중 흐름 (Dual-flow)'**이라는 방식을 썼습니다.
- 비유: imagine 쇼핑몰에 사진을 보는 직원 A와 글자를 읽는 직원 B가 따로 있습니다.
- 문제: A 는 사진만 보고, B 는 글자만 봅니다. 그리고 둘은 서로 대화하지 않고 각자 결론을 내립니다.
- 한계: 만약 한 상품에 사진이 5 장 (다른 각도, 다른 색상 등) 이 있고 글자는 1 개라면, A 는 5 장의 사진을 따로따로 처리해야 해서 혼란스럽습니다. 마치 5 개의 사진을 각각 다른 사람에게 보여주고 "이게 같은 물건이야?"라고 물어보는 꼴입니다. 또한, 사진 속에 상품 외에 배경 (침대, 소파 등) 이 많이 찍혀 있으면, A 는 "아, 이 침대가 팔리는구나?"라고 오해할 수도 있습니다.
2. MOON 의 해결책: "모든 정보를 한 번에 흡수하는 천재"
MOON 은 **'생성형 멀티모달 대규모 언어 모델 (Generative MLLM)'**을 기반으로 합니다.
- 비유: MOON 은 사진과 글을 동시에 보고, 서로 연결해서 이해하는 **'천재 쇼핑 도우미'**입니다.
- 핵심 기능:
- 한 번에 보기: 상품 사진이 5 장이든 10 장이든, 글자가 무엇이든 한 번에 다 보고 "아, 이건 같은 물건의 다양한 모습들이구나!"라고 자연스럽게 이해합니다. (다대일 관계 이해)
- 핵심만 집어보기 (Core Detection): 사진 속에 팔리지 않는 배경 (침대, 소파 등) 이 섞여 있어도, MOON 은 **"이건 배경이야, 진짜 상품은 이 쿠션이야"**라고 스스로 잘라내서 핵심만 집중합니다.
- 전문가 팀 (Guided MoE): MOON 내부에는 여러 명의 '전문가'가 있습니다. 어떤 전문가는 '카테고리 (의류, 전자제품 등)'를 잘 보고, 다른 전문가는 '세부 속성 (색상, 재질)'을 잘 봅니다. 이들을 지시하여 각자 필요한 부분만 집중하게 만듭니다.
3. 학습 방법: "실제 구매 기록으로 배운다"
기존 모델들은 "이 사진과 이 글자가 짝이 맞아요"라고 단순히 맞추는 연습을 했습니다. 하지만 MOON 은 실제 사람들이 무엇을 샀는지를 학습합니다.
- 비유: "이 사진을 보고 이 글을 읽었을 때, 실제로 사람들이 이 물건을 구매했다"는 데이터를 기반으로 학습합니다.
- 난이도 조절: 단순히 다른 물건을 오답으로 주는 게 아니라, **매우 비슷한 물건 (예: 빨간색 티셔츠 vs 분홍색 티셔츠)**을 오답으로 주어 모델이 미세한 차이까지 구별하도록 훈련시킵니다. 이를 '공간적/시간적 오답 샘플링'이라고 하는데, 마치 시험 문제를 더 어렵고 다양하게 만들어 실력을 키우는 것과 같습니다.
4. 새로운 시험지 (MBE 벤치마크)
연구팀은 이 모델을 평가하기 위해 **새로운 시험지 (MBE 벤치마크)**를 만들었습니다.
- 기존 시험지: 화장품 위주이거나, 실제 구매 행동이 없어서 현실과 동떨어진 경우가 많았습니다.
- 새로운 시험지 (MBE): 중국의 거대 이커머스 플랫폼에서 실제 310 만 건 이상의 구매 기록을 바탕으로 만들었습니다. 사용자가 실제로 검색하고 산 데이터를 바탕으로 하므로, 이 모델이 실제 쇼핑몰에서 얼마나 잘 작동하는지 정확하게 평가할 수 있습니다.
5. 결과: "어떤 일도 척척 해내는 만능 도우미"
실험 결과, MOON 은 다음과 같은 일들을 기존 모델들보다 훨씬 잘 해냈습니다.
- 검색: "이 사진과 비슷한 옷 찾아줘" (이미지 검색) 또는 "편안한 베개 찾아줘" (텍스트 검색) 를 정확히 수행.
- 분류: "이건 의류야, 전자제품이야?"를 정확히 분류.
- 속성 예측: "이 옷의 색상은? 재질은?"을 정확히 예측.
💡 요약
MOON은 단순히 사진과 글을 따로 보는 게 아니라, 실제 구매 행동을 학습하고, 배경 노이즈를 제거하며, 여러 전문가 팀을 운영하여 상품을 완벽하게 이해하는 차세대 쇼핑 AI입니다. 이는 앞으로 온라인 쇼핑에서 사용자가 원하는 상품을 더 빠르고 정확하게 찾아주는 데 큰 도움이 될 것입니다.