Applying reinforcement learning to optical cavity locking tasks: considerations on actor-critic architectures and real-time hardware implementation
Este artigo apresenta um estudo sobre a aplicação de aprendizagem por reforço profundo, especificamente o Deep Deterministic Policy Gradient dentro de um ambiente Gymnasium customizado, para alcançar o travamento autônomo de cavidades ópticas Fabry-Perot em regimes não lineares para detectores de ondas gravitacionais, discutindo também melhorias arquitetônicas e estratégias para implementação de hardware em tempo real.