Monocular Open Vocabulary Occupancy Prediction for Indoor Scenes
Il paper propone un nuovo framework per la previsione open-vocabulary dell'occupazione 3D in ambienti interni basato su monocularità e supervisione geometrica, che utilizza Gaussiani 3D incorporati nel linguaggio e tecniche di stabilizzazione innovative per superare i limiti delle metodologie esistenti, ottenendo risultati superiori sul dataset Occ-ScanNet.