From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction
Este trabalho propõe um método unificado para a reconstrução robusta de duas mãos a partir de imagens monoculares, combinando um codificador de fusão-alinhamento que integra implicitamente priores estruturais heterogêneos de modelos de visão fundamentais com um modelo de difusão livre de penetração que gera interações 3D fisicamente plausíveis, superando assim desafios de oclusão e alinhamento.