Synthetic Monitoring Environments for Reinforcement Learning
Il documento presenta gli Ambienti di Monitoraggio Sintetici (SME), una suite infinita di compiti di controllo continuo con politiche ottimali note, progettata per fornire diagnosi precise e trasparenti delle prestazioni degli agenti di Reinforcement Learning attraverso la valutazione sistematica sia in-distribution che out-of-distribution.