NOVA3R: Non-pixel-aligned Visual Transformer for Amodal 3D Reconstruction
NOVA3R ist ein neuartiger, feed-forward-Ansatz zur amodalen 3D-Rekonstruktion aus unpositionierten Bildern, der durch eine globale, pixelunabhängige Szenedarstellung und einen diffusionsbasierten Decoder vollständigere und physikalisch plausiblere Geometrien ohne überlappende Strukturen erzeugt als herkömmliche pixelalignierte Methoden.