Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Questo articolo propone due nuovi algoritmi basati sui dati per determinare strategie ottimali di prezzo e gestione delle scorte in un ambiente offline caratterizzato da domanda censurata e dipendente, superando le sfide legate alla violazione della proprietà di Markov e alla mancanza di informazioni sui profitti attraverso l'approssimazione di un MDP di ordine superiore e l'analisi di sopravvivenza.

Korel Gundem, Zhengling Qi

Pubblicato Thu, 12 Ma
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di essere il gestore di un negozio di scarpe molto popolare, ma con un problema strano: non sai mai quante persone vorrebbero comprare le tue scarpe se non avessi finito lo stock.

Ecco di cosa parla questo studio, spiegato come se stessimo chiacchierando al bar:

1. Il Problema: Il "Finto" Mercato

Immagina di avere solo 5 paia di scarpe. Arrivano 20 clienti. Ne vendi 5 e gli altri 15 se ne vanno a mani vuote.
Il tuo registro dice: "Ho venduto 5 paia".
Ma la realtà è: "La gente voleva 20 paia, ma io ne avevo solo 5".

In termini tecnici, questo si chiama domanda censurata. È come guardare un film dove, ogni volta che l'eroe incontra un drago, lo schermo diventa nero. Sai che c'era un drago, ma non sai quanto fosse grande o quanto fosse pericoloso. Nel tuo negozio, non sai mai quante vendite hai perso perché non avevi abbastanza merce.

2. L'Inganno della Memoria

C'è un'altra complicazione: le persone sono influenzate da ciò che è successo prima.
Se ieri hai venduto tutto e sei andato "out of stock" (senza merce), oggi i clienti potrebbero essere arrabbiati o scoraggiati e comprare meno. Se invece hai avuto sempre tanta merce, potrebbero fidarsi di più.
Quindi, la domanda di oggi dipende da cosa è successo ieri e l'altro ieri. È come se il tuo negozio avesse una "memoria" e il comportamento dei clienti cambiasse in base alla sua storia recente.

3. La Sfida: Imparare dal Passato senza Sbagliare

Il problema è che hai solo un vecchio registro (i dati offline) pieno di queste informazioni incomplete. Vuoi capire qual è la strategia perfetta:

  • A che prezzo vendere le scarpe?
  • Quanti ordini fare al fornitore?

Se provi a usare le regole matematiche classiche, falliscono perché:

  1. Non sai la vera domanda (è censurata).
  2. Il passato influenza il futuro in modo complicato (non è una semplice sequenza di eventi indipendenti).
  3. La strategia migliore cambia nel tempo (non è statica).

4. La Soluzione: I "Ricordi" e la "Pazienza"

Gli autori del paper hanno inventato un modo intelligente per aggirare il problema. Immagina di non guardare solo "cosa è successo oggi", ma di tenere traccia di quante volte di fila sei andato "out of stock".

Hanno creato una sorta di "macchina del tempo" (chiamata MDP di ordine superiore) che dice: "Ok, non so quante scarpe volevano comprare, ma so che sono andato a secco per 3 giorni di fila. Questo significa che la domanda reale è probabilmente altissima e i clienti sono frustrati. Quindi, domani devo abbassare il prezzo e ordinare più merce".

Per fare questo calcolo, hanno preso in prestito due idee da altri campi:

  • Dall'Intelligenza Artificiale (Reinforcement Learning): Come un videogiocatore che impara guardando le partite registrate di un campione, senza dover giocare di nuovo.
  • Dalla Medicina (Analisi di Sopravvivenza): I medici usano queste tecniche per capire quanto tempo un paziente sopravvive anche se smette di fare controlli. Qui, la usano per capire "quanto tempo" la domanda è rimasta nascosta sotto la mancanza di merce.

5. Il Risultato

Hanno creato due nuovi algoritmi (ricette matematiche) che:

  1. Guardano i vecchi dati, anche quelli "mutilati" dalla mancanza di merce.
  2. Ricostruiscono la verità nascosta.
  3. Ti dicono esattamente quanto prezzo mettere e quanto ordinare per guadagnare il massimo.

Hanno anche dimostrato matematicamente che il loro metodo funziona bene anche con pochi dati e hanno fatto dei test al computer che confermano che funziona meglio dei metodi vecchi.

In Sintesi

Questo paper è come un detective che, guardando un vecchio diario di un negozio dove mancano le pagine finali (perché la merce finiva), riesce a ricostruire la storia completa e a dirti: "Ehi, se avessi fatto così e così, avresti guadagnato il doppio!". È il primo metodo al mondo che riesce a fare questo quando la domanda dipende dalla storia passata ed è nascosta dalla mancanza di prodotti.