Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
본 논문은 중력파 검출기를 위한 비선형 영역 내 파브리-페로 광학 공동의 자율 잠금(autonomous locking)을 달로 달성하기 위해, 커스텀 Gymnasium 환경 내에서 심층 결정론적 정책 경사(Deep Deterministic Policy Gradient)를 적용하는 심층 강화 학습에 관한 연구를 제시하며, 이와 함께 구조적 개선 사항 및 실시간 하드웨어 구현 전략에 대해서도 논의한다.