Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dieser Artikel stellt einen datengestützten Ansatz vor, der durch die Kombination von Offline-Reinforcement-Learning und Überlebensanalyse optimale Preis- und Lagerstrategien für sequenzielle Entscheidungen unter zensierter und abhängiger Nachfrage ermittelt, wobei finite-Stichproben-Regressionsgrenzen die Wirksamkeit der vorgeschlagenen Algorithmen belegen.

Korel Gundem, Zhengling Qi

Veröffentlicht Thu, 12 Ma
📖 3 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind der Manager eines kleinen, aber sehr beliebten Cafés. Ihr Ziel ist es, jeden Tag genau die richtige Menge an Kuchen zu backen und den perfekten Preis dafür festzulegen, um maximalen Gewinn zu machen.

Das Problem ist jedoch, dass die Welt nicht so funktioniert, wie Sie es planen:

  1. Der verlorene Kuchen (Zensierung): Wenn Sie nur 10 Kuchen gebacken haben, aber 20 Kunden kommen, verkaufen Sie nur 10. Die anderen 10 Kunden gehen leer aus. Sie wissen also nicht, wie viel Nachfrage es wirklich gegeben hätte, wenn Sie mehr gebacken hätten. Die Daten sind „zensiert" – Sie sehen nur das, was verkauft wurde, nicht das, was hätte verkauft werden können.
  2. Die Stimmungsschwankungen (Abhängigkeit): Die Nachfrage hängt nicht nur vom heutigen Preis ab. Wenn Sie gestern einen sehr niedrigen Preis hatten und viele Leute kamen, sind die Kunden heute vielleicht noch hungriger oder haben sich daran gewöhnt. Die Vergangenheit beeinflusst die Gegenwart.
  3. Die alte Liste (Offline-Daten): Sie haben keine Zeit, heute erst zu experimentieren und Fehler zu machen. Sie müssen aus einer alten Liste (einem Datensatz) lernen, die Sie von Ihrem Vorgänger oder aus den letzten Jahren haben. In dieser Liste stehen Preise, Mengen und Verkaufszahlen – aber mit den oben genannten Lücken und Verzerrungen.

Was macht dieses Papier nun?

Die Autoren haben eine neue Methode entwickelt, um aus diesen „fehlerhaften" alten Daten die perfekte Strategie für die Zukunft abzuleiten.

Stellen Sie sich vor, Sie versuchen, ein komplexes Puzzle zu lösen, bei dem viele Teile fehlen und die anderen Teile sich bewegen.

  • Das Problem mit dem „Markov-Modell": Normalerweise würde man sagen: „Der heutige Zustand hängt nur von gestern ab." Aber wegen der zensierten Daten (wir wissen nicht, wie viele Kunden weggingen) funktioniert diese einfache Regel nicht mehr. Die Geschichte ist komplizierter geworden.
  • Die Lösung – Ein höheres Gedächtnis: Die Forscher sagen: „Okay, wenn wir nicht nur auf den gestrigen Tag schauen können, schauen wir uns die letzten drei Tage an, besonders die Tage, an denen wir wahrscheinlich zu wenig Kuchen hatten." Sie bauen ein Modell, das sich an eine längere Geschichte erinnert, um die Lücken in den Daten zu füllen.
  • Die zwei neuen Werkzeuge: Sie entwickeln zwei intelligente Algorithmen (Computer-Programme), die wie Detektive arbeiten:
    • Der eine nutzt Techniken aus dem Überlebensanalyse (wie Ärzte sie nutzen, um zu berechnen, wie lange Patienten ohne Behandlung überleben, basierend auf unvollständigen Daten), um die „verlorenen" Kunden zu schätzen.
    • Der andere nutzt Offline-Reinforcement Learning (Lernen aus alten Spielen, ohne selbst zu spielen), um die besten Entscheidungen zu finden.

Das Ergebnis:

Am Ende haben Sie einen „perfekten Koch", der Ihnen sagt: „Backe heute 15 Kuchen und verkaufe sie für 4,50 Euro." Und das, obwohl die alten Daten unvollständig waren.

Die Autoren haben bewiesen, dass ihre Methode mathematisch solide ist (sie machen nicht zu viele Fehler) und haben in Tests gezeigt, dass sie wirklich funktioniert. Sie haben sogar den Code veröffentlicht, damit andere Cafés (oder Lagerhallen) diese Methode nutzen können.

Kurz gesagt:
Dieses Papier ist wie ein neuer, smarter Kochbuch-Ratgeber, der Ihnen hilft, aus unvollständigen alten Rezepten und Verkaufszahlen die perfekte Strategie zu lernen, um genau die richtige Menge zu produzieren und den besten Preis zu setzen – selbst wenn Sie nie genau wussten, wie viele Kunden eigentlich kommen wollten.