Hyperspherical Latents Improve Continuous-Token Autoregressive Generation
O artigo apresenta o SphereAR, um modelo de geração de imagens autoregressivo que utiliza latentes em hiperesfera para estabilizar a decodificação e eliminar o colapso de variância, alcançando desempenho superior ao estado da arte em modelos de difusão e geração mascarada com escalas de parâmetros comparáveis.