Learnability Window in Gated Recurrent Neural Networks
Dit artikel presenteert een statistische theorie die aantoont hoe de vervalgeometrie van het effectieve leervermogen en zwaarstaartige gradiëntruis samen de maximale tijdschaal bepalen waarop terugkerende neurale netwerken met poortmechanismen structurele afhankelijkheden kunnen leren.