Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking
Questo articolo propone un controllore ibrido che combina l'apprendimento per rinforzo profondo (DRL) con la ricerca del massimo limitata (bounded extremum seeking) per migliorare la robustezza e le prestazioni dei sistemi di controllo non lineari a tempo variabile, come dimostrato nella sintonizzazione automatica di un acceleratore di particelle.