Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
Questo articolo presenta uno studio sull'applicazione del deep reinforcement learning, nello specifico il Deep Deterministic Policy Gradient all'interno di un ambiente Gymnasium personalizzato, per ottenere il blocco autonomo di cavità ottiche Fabry-Perot in regimi non lineari per rilevatori di onde gravitazionali, discutendo inoltre miglioramenti architettonici e strategie per l'implementazione hardware in tempo reale.