Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations
Le papier propose la méthode PATRO, une approche simple et efficace qui ajuste les estimations d'expériences aléatoires de manière indépendante pour optimiser simultanément les décisions de déploiement et les choix opérationnels en aval, offrant des performances proches de l'optimalité bayésienne tout en évitant les pertes dues à l'asymétrie des coûts d'erreur.