Why Are Linear RNNs More Parallelizable?
Diese Arbeit erklärt die überlegene Parallelisierbarkeit linearer RNNs im Vergleich zu nichtlinearen RNNs durch eine Verbindung zu Komplexitätsklassen, wonach lineare RNNs logarithmische Tiefenschaltungen darstellen, während nichtlineare Varianten P-vollständige Probleme lösen können, was eine fundamentale Barriere für ihre effiziente Parallelisierung darstellt.