Synthetic Monitoring Environments for Reinforcement Learning
Este artículo presenta los Entornos de Monitoreo Sintético (SMEs), una suite infinita de tareas de control continuo con políticas óptimas conocidas que permiten diagnósticos precisos y evaluaciones rigurosas de algoritmos de Aprendizaje por Refuerzo, transformando la evaluación empírica en un análisis científico estandarizado.