Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD
Cet article analyse les propriétés de convergence et les dynamiques d'échappement de la descente de gradient stochastique dans des paysages unidimensionnels, en démontrant comment les caractéristiques du bruit et la géométrie du paysage influencent les échelles de temps de convergence vers les minima locaux et les probabilités d'échappement des maxima locaux.