Pailitao-VL: Unified Embedding and Reranker for Real-Time Multi-Modal Industrial Search

이 논문은 알리바바 전자상거래 플랫폼의 실시간 산업 검색을 위해 절대 ID 인식 임베딩과 비교·보정 리스트와식 리랭커를 도입하여 정밀도와 효율성을 동시에 극대화한 Pailitao-VL 시스템을 제안하고 그 우수성을 입증했습니다.

Lei Chen, Chen Ju, Xu Chen, Zhicheng Wang, Yuheng Jiao, Hongfeng Zhan, Zhaoyang Li, Shihao Xu, Zhixiang Zhao, Tong Jia, Lin Li, Yuan Gao, Jun Song, Jinsong Lan, Xiaoyong Zhu, Bo Zheng

게시일 2026-03-06
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

파일타오-VL: 쇼핑몰 검색을 위한 '초능력의 눈과 뇌'

이 논문은 알리바바 그룹에서 개발한 **'파일타오-VL(Pailitao-VL)'**이라는 새로운 검색 시스템을 소개합니다. 이 시스템은 우리가 쇼핑몰에서 물건을 찾을 때, 단순히 '옷'이나 '신발' 같은 큰 카테고리만 찾는 게 아니라, **정확히 내가 원하는 그 한 가지 제품 (예: 특정 모델의 2024 년형 빨간색 운동화)**을 찾아내는 데 특화되어 있습니다.

기존 시스템이 가진 세 가지 큰 문제점을 해결하기 위해 고안된 이 기술은 크게 두 단계로 나뉩니다. 마치 거대한 도서관에서 책을 찾는 과정에 비유해 설명해 드리겠습니다.


1. 문제점: 기존 시스템은 왜 부족할까?

기존의 검색 시스템은 두 가지 큰 한계가 있었습니다.

  1. 너무 포괄적인 검색 (Granularity 부족):
    • 비유: "차"라고 검색하면 스포츠카, SUV, 세단 모두 다 나옵니다. 하지만 내가 원하는 건 "특정 브랜드의 2024 년형 세단, 앞유리 모양이 약간 다른 모델"입니다. 기존 시스템은 이 미세한 차이를 구별하지 못해 엉뚱한 차를 추천합니다.
  2. 환경에 너무 민감함 (Noise 취약성):
    • 비유: 비가 오거나 어두운 밤에, 혹은 배경이 지저분한 사진으로 검색하면系统在 "이게 뭐지?" 하며 헷갈려 합니다. 조명이나 배경 잡음에 쉽게 흔들립니다.
  3. 속도와 정확도의 딜레마 (Efficiency Gap):
    • 비유: 정확한 답을 찾으려면 천재적인 두뇌 (거대한 AI) 가 모든 책을 하나씩 꼼꼼히 읽어야 하는데, 이렇게 하면 검색 결과가 나오기까지 너무 오래 걸립니다. 쇼핑몰처럼 수천 명이 동시에 검색하는 곳에서는 감당할 수 없습니다.

2. 해결책 1: 파일타오-VL-Embedding (초능력의 눈)

"수억 권의 책을 한눈에 스캔하는 도서관 사서"

이 단계는 검색어를 입력했을 때, 수억 개의 상품 중에서 후보군을 빠르게 추려내는 '검색 (Embedding)' 역할을 합니다.

  • 기존 방식 (비교하기): "이 책과 저 책은 비슷해?"라고 물어보며 비슷한 것끼리 묶는 방식입니다. 하지만 "정확히 같은 책"인지 "비슷한 책"인지 구별이 모호할 때가 많습니다.
  • 파일타오의 방식 (신분증 확인):
    • 이 시스템은 **"이 물건은 정확히 'A'라는 ID(신분증) 를 가진 물건이다"**라고 확실히 가르칩니다.
    • AI 에이전트 (지식인): 수억 개의 상품 데이터를 AI 가 스스로 정리합니다. "이건 같은 제품인데 사진이 다른가?", "이건 다른 제품인가?"를 AI 가 직접 판단하여 깨끗한 데이터로 만듭니다.
    • 결과: 이제 시스템은 "차"라는 큰 개념이 아니라, **"앞유리 모양이 이렇고, 번호가 12345 인 그 특정 차"**를 정확히 찾아냅니다. 마치 수백만 개의 물건 중에서도 오직 하나만 정확히 집어내는 '초능력의 눈'이 된 것입니다.

3. 해결책 2: 파일타오-VL-Reranker (비교하는 현명한 심사위원)

"후보들끼리 대결시켜서 최강자를 가리는 심사위원"

검색을 통해 100 개 정도의 후보가 나왔을 때, 그중에서 진짜 원하는 것을 골라내는 '재순위화 (Reranking)' 단계입니다.

  • 기존 방식 (혼자 평가하기): 후보 1 번, 2 번, 3 번을 각각 따로 불러와서 "이거 맞나요? (Yes/No)"라고 물었습니다. 하지만 1 번과 2 번을 비교하지 않으면, 둘 다 'Yes'라고 해서 순서를 매기기 어렵습니다.
  • 파일타오의 방식 (그룹 대결 & 절대 점수):
    • 조별 대결 (Chunkwise): 10 명씩 그룹을 지어 "이 10 명 중에서 누가 가장 잘 어울려?"라고 비교하게 합니다. 서로 비교하면 미세한 차이 (색감, 디자인 디테일) 를 훨씬 잘 알아챕니다.
    • 절대 점수 (Absolute Scoring): 그룹을 바꿔도 일관된 기준을 유지하기 위해, 각 상품에 "완벽함 (100 점)", "좋음 (80 점)", "보통 (50 점)" 같은 절대적인 점수도 매깁니다.
    • 결합: 그룹 내에서의 순위와 절대 점수를 합쳐서, 최종적으로 가장 적합한 상품을 최상단에 배치합니다.
    • 속도: 모든 상품을 한 번에 다 비교하는 게 아니라, 10 명씩 쪼개서 병렬로 처리하기 때문에 엄청나게 빠릅니다.

4. 실제 성과: 쇼핑몰에서 어떤 변화가 있었나?

이 시스템을 알리바바 쇼핑몰에 적용한 결과 놀라운 변화가 있었습니다.

  • 속도: 검색 결과가 나오는 시간이 0.07 초 (70 밀리초) 정도로 빨라져, 사용자가 기다리는 동안 화면이 깜빡일 새도 없습니다.
  • 판매 증가 (GMV):
    • 전체 쇼핑몰에서 매출이 2% 증가했습니다.
    • 특정 제품 카테고리에서는 매출이 6% 증가했습니다.
    • 가장 놀라운 점: "가격 비교"나 "정확한 모델 찾기" 같은 AI 검색 기능에서는 매출이 무려 20% 급증했습니다.

요약

파일타오-VL은 마치 **"수억 개의 물건 중에서도 오직 내가 원하는 그 한 가지 제품을, 어두운 밤이나 흐릿한 사진에서도 정확히 찾아내고, 다른 후보들과 비교해서 가장 좋은 것을 순식간에 골라주는 초고성능 AI 비서"**입니다.

이 기술은 단순히 검색을 빠르게 하는 것을 넘어, 사용자가 원하는 것을 정확히 이해하고 판매로 이어지게 하는 차세대 쇼핑몰의 핵심 기술로 자리 잡았습니다.