Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

이 논문은 추천 시스템의 프리랭킹 단계에서 발생하는 이질적인 샘플 간의 경계 충돌과 비효율적인 계산 자원 할당 문제를 해결하기 위해, 손쉬운 샘플과 어려운 샘플을 분리하여 각각에 최적화된 경로를 제공하고 계산 예산을 적응적으로 할당하는 '이질성 인식 적응형 프리랭킹 (HAP)' 프레임워크를 제안하고 Toutiao 생산 환경에서 검증한 결과를 제시합니다.

Pengfei Tong, Siyuan Chen, Chenwei Zhang, Bo Wang, Qi Pi, Pixun Li, Zuotao Liu

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

모든 후보가 똑같은 건 아닙니다: 추천 시스템의 '스마트 필터링' 혁명

이 논문은 티토우 (Toutiao, 중국 뉴스 앱) 와 같은 거대한 추천 시스템이 어떻게 수억 개의 콘텐츠 중에서 사용자에게 딱 맞는 것을 찾아내는지, 그리고 그 과정에서 겪는 '혼란'을 어떻게 해결했는지에 대한 이야기입니다.

비유하자면, 이 시스템은 수백만 명의 지원자 (후보 콘텐츠) 가 지원한 거대한 채용 면접과 같습니다.


1. 문제: "모든 지원자를 똑같이 대우하면 안 됩니다"

기존의 추천 시스템은 두 가지 큰 실수를 저지르고 있었습니다.

① "어려운 면접관"과 "쉬운 면접관"을 섞어서 혼란을 빚음

  • 상황: 시스템은 수천 개의 콘텐츠를 한 번에 검토합니다. 그중에는 "이건 확실히 싫어할 거야"라는 쉬운 거절 (Easy Negatives) 과, "이건 좋아할 수도 있고 싫어할 수도 있어"라는 어려운 판단 (Hard Negatives) 이 섞여 있습니다.
  • 문제: 기존 방식은 이들을 모두 한锅 (한 냄비) 에 넣고 섞어서 학습시켰습니다. 마치 어려운 수학 문제를 풀어야 하는 수험생에게, 아주 쉬운 1+1 문제도 함께 풀게 하면서 "정답은 1+1 이야!"라고 소리치는 것과 같습니다.
  • 결과: 시스템은 "어려운 문제"에 너무 많은 에너지를 쏟느라 "쉬운 문제"를 무시하게 되었고, 오히려 전체적인 판단력이 흐려졌습니다. (논문에서는 이를 기울기 충돌 (Gradient Conflict) 이라고 부릅니다.)

② "모든 지원자에게 슈퍼 면접관을 투입함"

  • 상황: 모든 콘텐츠를 판단할 때, 가장 똑똑하고 비싼 '슈퍼 면접관 (무거운 AI 모델)'을 모두에게 보냈습니다.
  • 문제: "이건 확실히 싫어할 거야"라는 쉬운 지원자에게도 슈퍼 면접관의 시간을 낭비한 것입니다. 초등학교 입시 문제를 풀기 위해 노벨상 수상자를 데려온 격입니다.
  • 결과: 비용은 엄청나게 들었는데, 성능 향상은 미미했습니다.

2. 해결책: HAP (스마트 2 단계 채용 시스템)

저자들은 이 문제를 해결하기 위해 HAP(Heterogeneity-Aware Adaptive Pre-ranking) 라는 새로운 시스템을 만들었습니다. 이는 두 가지 핵심 전략을 사용합니다.

전략 1: "난이도별 그룹 나누기" (Gradient-Harmonized Contrastive Learning)

  • 비유: 면접을 볼 때, 지원자들을 어려운 그룹쉬운 그룹으로 나누어 따로 평가합니다.
  • 작동 원리:
    • 어려운 그룹: "이거 맞을까? 아닐까?" 고민이 되는 콘텐츠들은 별도의 심층 분석을 받습니다.
    • 쉬운 그룹: "아, 이건 확실히 싫어할 거야"라는 콘텐츠들은 간단한 체크만 받습니다.
    • 효과: 두 그룹이 서로의 평가 기준을 방해하지 않게 되어, 시스템이 훨씬 더 정확하게 학습합니다.

전략 2: "스마트한 면접관 배치" (Difficulty-Aware Model Routing)

  • 비유: 1 단계 (간이 면접)2 단계 (본 면접) 로 나누는 것입니다.
    • 1 단계 (가벼운 면접관): 모든 지원자를 빠르게 훑어봅니다. "아, 이건 확실히 아니야"라고 판단되면 바로 탈락시킵니다. (비용 절감)
    • 2 단계 (슈퍼 면접관): 1 단계에서 살아남은, 판단이 애매한 어려운 지원자들만 뽑아내어 진짜 똑똑한 면접관에게 심층 평가를 시킵니다.
  • 효과: 똑똑한 면접관 (고성능 AI) 은 오직 가장 중요한 어려운 경우에만 투입되므로, 전체 시스템은 더 빠르고 저렴해졌으면서도 정확도는 오히려 올라갔습니다.

3. 실제 성과: "돈도 아끼고, 효과도 쑥쑥"

이 시스템을 티토우 (Toutiao) 라는 거대한 뉴스 앱에 적용한 결과는 놀라웠습니다.

  • 사용자 체류 시간: 사용자가 앱을 보는 시간이 0.4% 증가했습니다. (수억 명의 사용자라면 엄청난 숫자입니다!)
  • 활성 사용자: 매일 앱을 켜는 사람이 0.05% 늘어났습니다.
  • 비용: 컴퓨터 자원 (CPU) 사용량은 6% 줄었습니다.
  • 지속성: 이 시스템은 이미 9 개월 동안 실제 서비스에서 성공적으로 운영 중입니다.

4. 결론: "맞춤형이 최고다"

이 논문의 핵심 메시지는 "모든 것을 똑같이 대우하지 마라" 입니다.

  • 쉬운 것은 가볍게 처리하고,
  • 어려운 것에만 집중적으로 에너지를 쏟는 스마트한 분업 시스템이 만들어졌습니다.

마치 병원에서 가벼운 감기 환자는 일반 진료실에서 빠르게 처리하고, 중환자만 전문의가 정밀하게 치료하는 것과 같습니다. 이 '스마트한 분업' 덕분에 추천 시스템은 더 똑똑해지고, 더 빠르며, 더 저렴해졌습니다.

또한, 저자들은 이 연구를 위해 대규모 데이터셋 (ToutiaoRec) 을 공개하여, 전 세계 연구자들이 이 '난이도별 학습' 방식을 더 발전시킬 수 있도록 도왔습니다.