Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
Diese Arbeit präsentiert eine Studie über die Anwendung von Deep Reinforcement Learning, spezifisch Deep Deterministic Policy Gradient innerhalb einer benutzerdefinierten Gymnasium-Umgebung, um das autonome Verriegeln von Fabry-Perot-optischen Kavitäten in nichtlinearen Regimen für Gravitationswellendetektoren zu erreichen, während gleichzeitig architektonische Verbesserungen und Strategien für die Echtzeit-Hardwareimplementierung diskutiert werden.