Synthetic Monitoring Environments for Reinforcement Learning
Este artigo apresenta as Synthetic Monitoring Environments (SMEs), uma suite infinita de tarefas de controle contínuo com políticas ótimas conhecidas e métricas de desempenho exatas, projetada para permitir diagnósticos precisos e análises científicas rigorosas do comportamento de agentes de Aprendizado por Reforço, superando as limitações de benchmarks atuais.