Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

이 논문은 과거 수요에 의존하고 재고 부족으로 인해 판매 데이터가 검열 (censored) 되는 동적 재고 및 가격 결정 문제를 해결하기 위해, 검열된 의존적 수요 환경에서 최적 정책을 학습하는 새로운 데이터 기반 알고리즘을 제안하고 그 성능을 이론적 및 실험적으로 검증합니다.

Korel Gundem, Zhengling Qi

게시일 Thu, 12 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🏪 이야기: "신비로운 가게"와 보이지 않는 손실

상상해 보세요. 여러분이 신비로운 가게를 운영한다고 칩시다. 이 가게에는 두 가지 아주 까다로운 규칙이 있습니다.

  1. 손님의 기억력 (의존적 수요): 오늘 손님이 많이 오면 내일도 많이 오고, 오늘 손님이 없으면 내일도 없을 수 있습니다. 즉, 오늘의 상황은 어제의 상황에 영향을 받습니다.
  2. 보이지 않는 손실 (검열된 데이터): 만약 가게에 재고가 10 개밖에 없는데, 100 명이 찾아와서 모두 사려 한다면? 가게는 10 개만 팔고, 나머지 90 명은 빈손으로 돌아갑니다.
    • 문제점: 가게 주인은 "아, 100 명이 왔구나!"라고 알 수 없습니다. 기록에는 **"10 개 팔림"**이라고만 남습니다. 나머지 90 명은 **보이지 않는 손실 (Censored Demand)**이 되어버린 거죠.

이전 연구들은 보통 "재고가 충분해서 다 팔았다"고 가정하거나, 손님이 매일 독립적으로 온다고 생각했습니다. 하지만 이 논문의 저자들은 **"재고가 부족해서 팔지 못한 손실도 계산해야 하고, 손님의 기분이 어제와 이어져야 한다"**는 현실적인 문제를 해결하려 했습니다.

🧩 해결책: "시간을 거슬러 올라가는 탐정"

이 문제를 해결하기 위해 저자들은 두 가지 영리한 방법을 썼습니다.

1. "보이지 않는 손실"을 추측하는 고차원 지도 (고차 MDP)

보통의 지도 (MDP) 는 "지금 재고가 10 개"라는 정보만 보고 다음을 결정합니다. 하지만 이 가게는 재고가 부족해서 손님이 사라진 적이 몇 번이나 있었는지 (연속된 실패) 가 중요합니다.

저자들은 **"재고가 부족해서 손님이 사라진 적이 연속으로 몇 번이나 있었나?"**를 지도에 추가했습니다. 마치 탐정이 "이 가게는 어제 3 번이나 재고가 떨어져서 손님을 거절했어. 그러니 오늘 손님은 화가 났을 수도 있어"라고 추측하는 것과 같습니다. 이렇게 복잡한 상황을 고려할 수 있는 고급 지도를 그려낸 것입니다.

2. 과거의 유령들을 부르는 두 가지 마법 (새로운 알고리즘)

이제 이 고급 지도를 바탕으로 가장 돈을 잘 벌 수 있는 전략을 찾아야 합니다. 하지만 과거 데이터에는 '팔지 못한 손실' 정보가 빠져있어 계산이 어렵습니다.

저자들은 두 가지 마법 (알고리즘) 을 개발했습니다.

  • 마법 1 (오프라인 강화 학습): 과거의 기록 (데이터) 을 가지고, "만약 그때 재고를 더 많이 가져갔다면 어땠을까?"라고 시뮬레이션을 돌려봅니다.
  • 마법 2 (생존 분석): 의학에서 "환자가 언제까지 살아남을지"를 분석하는 방법을 차용했습니다. "손님이 재고가 떨어지기 전에 얼마나 오래 기다렸을까?"를 분석하여, 보이지 않았던 90 명의 손님이 실제로 얼마나 많았는지 역산해냅니다.

이 두 가지 마법을 합쳐서, 보이지 않았던 손실까지 포함한 완벽한 계산을 해내는 것입니다.

📊 결과: 실험실에서의 증명

저자들은 이 방법을 컴퓨터로 실험해 보았습니다. 결과는 놀라웠습니다.

  • 기존 방법들보다 훨씬 정확하게 최적의 가격재고량을 찾아냈습니다.
  • 특히, 재고가 부족해서 손실을 본 상황에서도 어떻게 대처해야 할지 잘 알아냈습니다.

💡 핵심 요약

이 논문은 **"과거 데이터에 숨겨진 '팔지 못한 기회'를 찾아내고, 손님의 심리가 어제와 이어진다는 점을 고려하여, 가게 주인이 가장 돈을 많이 벌 수 있는 지혜를 찾아주는 첫 번째 방법"**을 제시했습니다.

마치 과거의 실수를 통해 미래를 예측하는 똑똑한 비서를 만든 것과 같습니다. 이제 이 비서는 재고가 부족해서 손님이 떠난 순간조차 놓치지 않고, "다음엔 재고를 더 많이 두거나 가격을 조금만 조정하자"고 조언해 줄 것입니다.


한 줄 요약:

"재고가 부족해서 팔지 못한 손실과 손님의 기억력을 모두 고려하여, 과거 데이터를 통해 미래의 최고의 가격과 재고 전략을 찾아내는 똑똑한 방법을 개발했습니다."