Why Are Linear RNNs More Parallelizable?
Este artículo establece que las RNN lineales son altamente paralelizables porque equivalen a circuitos aritméticos de profundidad logarítmica, mientras que las RNN no lineales enfrentan barreras fundamentales de paralelización al poder resolver problemas completos en P, ofreciendo así una base teórica para equilibrar expresividad y eficiencia en arquitecturas de modelos de lenguaje.