Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

이 논문은 소매 판매 예측을 위해 다양한 머신러닝 모델을 비교 분석한 결과, 복잡한 딥러닝 아키텍처보다 XGBoost 와 같은 트리 기반 앙상블 모델이 결측치와 간헐적 수요가 있는 실제 환경에서 더 우수한 성능을 보였음을 시사합니다.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🛒 배경: 왜 예측이 어려울까? (오프라인 매장의 현실)

이 연구는 대형 온라인 쇼핑몰이 아니라, **실제 오프라인 매장 (Brick-and-Mortar)**을 대상으로 했습니다.

  • 온라인 쇼핑몰: 모든 데이터가 한곳에 모여 있고, 매일 꾸준히 주문이 들어옵니다. (데이터가 빽빽하고 깨끗함)
  • 오프라인 매장: 수천 개의 매장이 있고, 각 매장의 사정은 다릅니다. 어떤 날은 비가 와서 손님이 없고, 어떤 날은 프로모션으로 폭주합니다. 또, 재고가 없어서 팔지 못한 날도 많습니다. (데이터가 끊기고, 비어있고, 소음이 많음)

연구진은 "이런 ** messy(지저분하고 불규칙한)** 데이터를 가지고 6 개월 뒤의 판매량을 예측하는 데 어떤 AI 가 가장 잘할까?"를 비교했습니다.


🥊 주인공들: 두 가지 AI 팀

연구진은 두 가지 팀을 대결시켰습니다.

  1. 초고급 스펙의 딥러닝 팀 (Neural Networks):

    • 특징: N-BEATS, TFT 같은 최신 모델들입니다. 마치 수학 천재처럼 방대한 데이터를 학습하고 복잡한 패턴을 찾아내려 합니다.
    • 장점: 데이터가 엄청나게 많고 깨끗하면 아주 강력합니다.
    • 단점: 데이터가 조금만 지저분하거나 끊겨도 당황해서 엉뚱한 답을 내놓을 수 있습니다.
  2. 실전 베테랑의 트리 기반 팀 (Gradient Boosting Trees):

    • 특징: XGBoost, LightGBM 같은 모델들입니다. 마치 经验丰富的(경험 많은) 현장 소장처럼, "이런 날에는 A 상품이 잘 팔리고, 저런 날에는 B 상품이 안 팔린다"는 식으로 규칙을 하나하나 찾아서 예측합니다.
    • 장점: 데이터가 조금 지저분해도 꿋꿋하게 잘 처리하고, 계산 속도도 빠릅니다.
    • 단점: 데이터가 너무 적으면 천재만큼의 성능을 내기 어렵습니다.

🏆 실험 결과: 누가 이겼을까?

결과는 놀라웠습니다. 실전 베테랑인 '트리 기반 팀'이 압도적으로 이겼습니다.

  • **XGBoost(트리 기반)**가 가장 낮은 오차로 1 위를 차지했습니다.
  • 반면, 최신 딥러닝 팀은 데이터가 지저분한 오프라인 매장 환경에서는 기대만큼의 성능을 내지 못했습니다.

🤔 왜 이런 일이 일어났을까? (핵심 비유)

  1. 데이터의 '지저분함' 문제:

    • 오프라인 매장 데이터는 재고 부족이나 시스템 오류로 인해 **빈칸 (Missing values)**이 많습니다.
    • 연구진은 이 빈칸을 채우기 위해 'SAITS'라는 고급 AI 를 썼습니다. 하지만 이 AI 가 빈칸을 채워 넣은 값들이 실제 현실과 너무 달라졌습니다. (예: 실제 판매량이 353 개였는데, AI 가 채운 값은 23 개로 줄여버림).
    • 비유: 마치 **요리사 (딥러닝)**에게 재료를 채워달라고 했더니, **실제 재료 (진짜 데이터)**가 아닌 **가짜 재료 (잘못 채워진 데이터)**를 넣은 요리책을 줬기 때문에, 요리사가 맛있는 요리를 못 한 것입니다.
  2. 지역 특유의 '취향' 문제:

    • 오프라인 매장은 지역마다 취향이 다릅니다. (서울 강남과 지방 소도시의 선호도가 다름).
    • 딥러닝은 모든 매장을 하나로 묶어서 "전체적인 평균"을 배우려 했지만, 오히려 개별 매장의 고유한 특징을 놓쳤습니다.
    • 트리 기반 모델은 "각 매장 (또는 상품 그룹) 마다 따로 모델을 훈련"시켰습니다. 마치 지역별 맞춤형 메뉴를 개발한 것처럼, 각 매장의 특성에 딱 맞는 예측을 해낸 것입니다.
  3. 속도와 효율성:

    • 딥러닝 모델을 훈련시키는 데는 수 시간에서 수 일이 걸렸지만, 트리 기반 모델은 수 분이면 끝났습니다.
    • 비유: 딥러닝은 거대한 슈퍼컴퓨터를 돌려서 정교한 지도를 그리는 반면, 트리 기반 모델은 현지 사정을 잘 아는 택시 기사처럼 빠르고 정확하게 목적지에 도착했습니다.

💡 결론: 우리에게 주는 교훈

이 연구는 우리에게 다음과 같은 중요한 메시지를 줍니다.

"무조건 최신이고 복잡한 AI 를 쓰는 것이 좋은 게 아니다. 내 문제 (데이터) 에 맞는 도구를 골라야 한다."

  • 온라인 쇼핑몰처럼 데이터가 많고 깨끗하다면? → 최신 딥러닝 (Transformer 등) 을 써도 좋습니다.
  • 오프라인 매장처럼 데이터가 지저분하고, 지역별 차이가 크다면?XGBoost 나 LightGBM 같은 '트리 기반 모델'이 훨씬 더 빠르고 정확합니다.

한 줄 요약:
"복잡한 최신 AI 가 항상 최고는 아니다. 오프라인 매장의 messy 한 현실에서는, 현장을 잘 아는 '실전 베테랑' (트리 기반 모델) 이 훨씬 더 잘한다!"