Effective and Efficient Masked Image Generation Models
O artigo apresenta o eMIGM, um modelo unificado de geração de imagens mascarada que, ao explorar fatores-chave de treinamento e amostragem, alcança desempenho superior ou comparável aos modelos de difusão contínua e autoregressivos mais avançados no ImageNet, exigindo significativamente menos avaliações de função (NFEs).