CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas
O artigo apresenta o CanvasMAR, um modelo autoregressivo inovador para previsão de vídeo que utiliza uma "tela" global desfocada e um currículo de amostragem do fácil ao difícil para gerar vídeos de alta fidelidade com menos etapas de amostragem, superando métodos anteriores e rivalizando com abordagens baseadas em difusão.