SOLARIS: Speculative Offloading of Latent-bAsed Representation for Inference Scaling

이 논문은 추론 시뮬레이팅 디코딩에서 영감을 받아 SOLARIS 라는 새로운 프레임워크를 제안하여, 메타의 광고 시스템에서 실시간으로 대규모 추천 모델의 추론을 가능하게 하고 수익 지표 0.67% 향상을 달성했다고 요약할 수 있습니다.

Zikun Liu, Liang Luo, Qianru Li, Zhengyu Zhang, Wei Ling, Jingyi Shen, Zeliang Chen, Yaning Huang, Jingxian Huang, Abdallah Aboelela, Chonglin Sun, Feifan Gu, Fenggang Wu, Hang Qu, Huayu Li, Jill Pan, Kaidi Pei, Laming Chen, Longhao Jin, Qin Huang, Tongyi Tang, Varna Puvvada, Wenlin Chen, Xiaohan Wei, Xu Cao, Yantao Yao, Yuan Jin, Yunchen Pu, Yuxin Chen, Zijian Shen, Zhengkai Zhang, Dong Liang, Ellie Wen

게시일 2026-04-15
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌞 SOLARIS: 거대한 추천 AI 의 '예상 주문' 시스템

메타 (Meta) 의 연구진이 개발한 SOLARIS라는 새로운 기술을 쉽게 설명해 드릴게요. 이 기술은 우리가 매일 보는 페이스북, 인스타그램 광고가 얼마나 똑똑하고 빠르게 작동하는지 비약적으로 높여줍니다.

1. 문제: "너무 똑똑하지만, 너무 느린 AI"

상상해 보세요. 거대한 도서관에 있는 **초고성능 AI(기반 모델, Foundation Model)**가 있습니다. 이 AI 는 전 세계 모든 사람의 취향을 분석해서 "누가 무엇을 좋아할지"를 100% 정확히 예측할 수 있습니다.

하지만 이 AI 는 너무 무겁고 느립니다.

  • 현실: 광고를 보여줄 때, 사용자의 요청이 들어오면 이 무거운 AI 가 "잠깐만요, 계산 중입니다"라고 답하면 광고는 1 초도 안 돼서 사라져버립니다. (지연 시간 문제)
  • 기존 해결책: 그래서 사람들은 이 거대한 AI 를 버리고, 가볍지만 똑똑하지 않은 **작은 AI(수직 모델, Vertical Model)**만 쓰거나, 거대 AI 의 답을 미리 가르쳐서 작은 AI 가 흉내 내게 했습니다. 하지만 이 방법은 정보의 75% 는 잃어버리는 '불완전한 학습'이었습니다.

2. 해결책: SOLARIS 의 '예상 주문' (Speculative Offloading)

SOLARIS 는 이 문제를 해결하기 위해 식당 주방에 비유할 수 있는 똑똑한 방식을 도입했습니다.

🍽️ 비유: "손님이 오기 전에 미리 요리하기"

  • 기존 방식: 손님이 메뉴를 주문하고 나서야 주방장이 재료를 꺼내서 요리합니다. (지연 발생)
  • SOLARIS 방식: 주방장 (거대 AI) 은 **"아마도 A 손님은 치킨을, B 손님은 파스타를 주문할 거야"**라고 미리 추측합니다. 그리고 손님이 실제로 주문하기 전에 미리 요리를 해두거나, 최소한 반조리 상태로 준비해 둡니다.

이게 바로 SOLARIS의 핵심입니다.

  1. 미리 계산 (Speculative Precomputation): 거대 AI 가 "앞으로 몇 시간 안에 누가 무엇을 볼지"를 미리 예측해서, 그 결과를 미리 계산해 둡니다.
  2. 비동기 작업: 이 계산은 사용자가 광고를 볼 때 방해하지 않고, 배경에서 조용히 일어납니다.
  3. 즉시 제공: 사용자가 광고를 보러 왔을 때, 미리 준비된 요리 (AI 의 예측 결과) 를 바로 내줍니다. 그래서 속도는 빠르지만, 거대 AI 의 똑똑함은 그대로 유지됩니다.

3. 만약 예상과 다르면? (계층적 특징 보충)

물론, "내가 치킨을 먹을 거라고 예상했는데 파스타를 주문할 수도 있죠?"라는 문제가 생깁니다. SOLARIS 는 이럴 때를 대비해 3 단계의 안전장치를 마련했습니다.

  1. 정확한 예상 (Hit): 미리 계산한 결과가 맞다면? 완벽한 요리를 바로 줍니다. (가장 좋음)
  2. 사용자 취향 평균 (Aggregated): 특정 메뉴를 못 준비했다면? "이 사람은 평소 치킨과 파스타를 다 좋아했으니, 두 가지 맛을 섞어서 줘야겠다"라고 사용자의 최근 취향 평균을 제공합니다.
  3. 비슷한 사람 참고 (Similarity): 아예 그 사람의 취향을 모른다면? "이 사람과 취향이 비슷한 C 친구가 좋아했던 메뉴를 참고해서 줘야겠다"라고 비슷한 친구의 취향을 빌려옵니다.

이렇게 하면 거대 AI 의 지식을 50% 에서 90% 이상까지 끌어올려서, 거의 모든 상황에 똑똑한 추천을 해줄 수 있게 됩니다.

4. 실제 성과: "메타의 광고 수익 1 억 달러 증가"

이 기술을 메타의 광고 시스템에 적용한 결과는 놀라웠습니다.

  • 속도: 사용자는 느려진 것을 전혀 느끼지 못했습니다. (지연 시간 없음)
  • 정확도: 광고 클릭률 (CTR) 과 구매 전환율 (CVR) 이 모두 향상되었습니다.
  • 수익: 전 세계적으로 광고 수익이 약 0.67% 증가했는데, 이는 **약 1 억 달러 (약 1,300 억 원)**에 해당하는 거대한 금액입니다.

📝 한 줄 요약

SOLARIS는 "너무 무거워서 쓸 수 없었던 거대 AI 의 지능을, '미리 예상해서 준비해 두는' 방식으로 가져와서, 우리가 광고를 볼 때 빠르고 똑똑한 추천을 가능하게 만든 혁신적인 기술입니다."

이제 여러분이 페이스북이나 인스타그램을 볼 때, "아, 이 광고는 SOLARIS 가 미리 준비해 둔 거였구나!"라고 생각하시면 됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →