Geometric Autoencoder for Diffusion Models
Deze paper introduceert de Geometric Autoencoder (GAE), een principieel framework dat Vision Foundation Model-priors en een nieuwe normalisatiestrategie combineert om een superieure balans te bereiken tussen compressie, semantische diepte en reconstructiestabiliteit, wat resulteert in state-of-the-art prestaties voor latent diffusion-modellen op ImageNet.