Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking
Dit artikel presenteert een hybride besturingsmethode die Deep Reinforcement Learning combineert met bounded extremum seeking om de robuustheid en prestaties van controllers voor niet-lineaire, tijdvariërende systemen te verbeteren, zoals gedemonstreerd bij de automatische afstelling van een deeltjesversneller.