Towards Understanding Adam Convergence on Highly Degenerate Polynomials
Este trabajo demuestra teórica y experimentalmente que el algoritmo Adam converge automáticamente y de forma lineal en polinomios altamente degenerados gracias a un mecanismo de desacoplamiento que amplifica la tasa de aprendizaje, superando así a los métodos tradicionales como el descenso de gradiente y el momentum en este tipo de funciones.