Generalizing Visual Geometry Priors to Sparse Gaussian Occupancy Prediction
Il paper presenta GPOcc, un framework che generalizza i prior geometrici visivi per la previsione di occupazione 3D monocular e in streaming, estendendo i punti superficiali verso l'interno lungo i raggi della camera per generare primitive Gaussiane volumetriche e ottenendo significativi miglioramenti di accuratezza e velocità rispetto allo stato dell'arte.