Hyperspherical Latents Improve Continuous-Token Autoregressive Generation
Die Arbeit stellt SphereAR vor, ein autoregressives Bildgenerierungsmodell, das durch die Einschränkung der Latents auf eine Hypersphäre die Varianzstabilität verbessert und damit erstmals reine Raster-Autoregressionsmodelle in der Bildqualität mit Diffusions- und Maskierungsmodellen konkurrieren lässt.