Geometric Autoencoder for Diffusion Models
Ce papier présente le Geometric Autoencoder (GAE), un cadre novateur qui améliore les modèles de diffusion latents en intégrant des priors de modèles de vision fondationnels et une normalisation latente, permettant d'atteindre des performances de génération d'images supérieures sur ImageNet-1K tout en équilibrant compression, profondeur sémantique et stabilité de reconstruction.