Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
Dit artikel presenteert een studie naar het toepassen van deep reinforcement learning, specifiek Deep Deterministic Policy Gradient binnen een aangepaste Gymnasium-omgeving, om autonome vergrendeling van Fabry-Perot optische caviteiten in niet-lineaire regimes voor zwaartekrachtgolfdetectoren te bereiken, terwijl tegelijkertijd architecturale verbeteringen en strategieën voor real-time hardware-implementatie worden besproken.