Hyperspherical Latents Improve Continuous-Token Autoregressive Generation
Het paper introduceert SphereAR, een autoregressief beeldgeneratiemodel dat door het beperken van VAE-latents tot een hypersfeer de variatie-collapse oplost en zo nieuwe state-of-the-art prestaties bereikt die concurreren met of zelfs beter zijn dan diffusion- en masked-generation-modellen.