Improving Conditional VAE with Non-Volume Preserving transformations
Este artigo propõe aprimorar os Autoencoders Variacionais Condicionais (CVAE) para geração de imagens, introduzindo um parâmetro de variância aprendível no decodificador e utilizando transformações não preservadoras de volume (NVP) para estimar a distribuição condicional do espaço latente, resultando em imagens com maior diversidade e qualidade, conforme demonstrado pela redução de 4% no FID e aumento de 7,6% na verossimilhança logarítmica em comparação com métodos anteriores.