Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling
Este artigo apresenta o algoritmo \texttt{SRTS} baseado em Amostragem de Thompson para otimização da razão de Sharpe em bandits estocásticos, estabelecendo limites de arrependimento superiores e inferiores que provam sua optimalidade de ordem e demonstrando seu desempenho superior em simulações empíricas.