Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
Cet article présente une étude sur l'application de l'apprentissage par renforcement profond, plus précisément le Deep Deterministic Policy Gradient au sein d'un environnement Gymnasium personnalisé, pour parvenir au verrouillage autonome de cavités optiques de Fabry-Perot dans des régimes non linéaires pour les détecteurs d'ondes gravitationnelles, tout en discutant également d'améliorations architecturales et de stratégies de mise en œuvre matérielle en temps réel.