Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking
Cet article propose un contrôleur hybride combinant l'apprentissage par renforcement profond et la recherche d'extremum bornée pour améliorer la robustesse et la performance des systèmes non linéaires à temps variable, comme démontré par une application au réglage automatique d'un accélérateur de particules.