Synthetic Monitoring Environments for Reinforcement Learning
Die Arbeit stellt „Synthetic Monitoring Environments" (SMEs) als eine unendliche Suite konfigurierbarer, kontinuierlicher Steuerungsaufgaben mit bekannten optimalen Strategien vor, die es ermöglichen, Reinforcement-Learning-Algorithmen durch präzise, white-box-Diagnosen und exakte Regret-Berechnungen systematisch zu analysieren und von empirischem Benchmarking zu einer rigorosen wissenschaftlichen Evaluation zu überführen.