A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design
Il paper propone l'algoritmo CLUB, un approccio di apprendimento per rinforzo che risolve le sfide dell'ottimizzazione delle riserve d'asta in ambienti multi-fase con bidders potenzialmente non veritieri e distribuzioni di rumore sconosciute, garantendo un rimpianto di ricavo sub-lineare attraverso l'uso di periodi tampone e una variante estesa di LSVI-UCB.