CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas
El artículo presenta CanvasMAR, un modelo autoregresivo de predicción de video que mejora la calidad y la coherencia de la generación con pocos pasos mediante la introducción de un "lienzo" global borroso como prior estructurado, un currículo de muestreo de fácil a difícil basado en el movimiento y una guía libre de clasificadores compuesta.