Hyperspherical Latents Improve Continuous-Token Autoregressive Generation
El artículo presenta SphereAR, un modelo de generación de imágenes autoregresivo que utiliza latentes hiperesféricos para estabilizar la decodificación y eliminar el colapso de varianza, logrando así un nuevo estado del arte en la generación de imágenes de ImageNet que supera a modelos de difusión y generación enmascarada en escalas comparables.