Learnability Window in Gated Recurrent Neural Networks
Este trabalho desenvolve uma teoria estatística que quantifica a janela máxima de aprendibilidade temporal em redes neurais recorrentes, demonstrando que a geometria do decaimento do envelope de taxa de aprendizado e a natureza do ruído de gradiente determinam regimes de crescimento (logarítmico, polinomial ou exponencial) desse horizonte, com validação experimental em diversas arquiteturas.