ConfCtrl: Enabling Precise Camera Control in Video Diffusion via Confidence-Aware Interpolation
El artículo presenta ConfCtrl, un marco de interpolación de video consciente de la confianza que permite a los modelos de difusión generar vistas novedosas geométricamente consistentes y visualmente plausibles a partir de solo dos imágenes, superando las limitaciones de los métodos existentes mediante una proyección ponderada por confianza y un mecanismo de corrección residual inspirado en el filtro de Kalman para manejar grandes cambios de perspectiva.