Learnability Window in Gated Recurrent Neural Networks
Diese Arbeit entwickelt eine statistische Theorie, die zeigt, wie die Abklinggeschwindigkeit eines effektiven Lernraten-Umhüllenden und schweres Gradientenrauschen den maximalen zeitlichen Horizont bestimmen, über den Gated Recurrent Neural Networks bei endlicher Stichprobengröße lernfähig sind.