Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
本論文は、重力波検出器の非線形領域におけるファブリ・ペロー光共振器の自律的なロックを実現するために、カスタムGymnasium環境内でのDeep Deterministic Policy Gradientを用いた深層強化学習を適用した研究を提示し、同時にアーキテクチャの改善およびリアルタイムのハードウェア実装に向けた戦略についても論じるものである。