GaussianFormer3D: Multi-Modal Gaussian-based Semantic Occupancy Prediction with 3D Deformable Attention
Die Arbeit stellt GaussianFormer3D vor, ein neuartiges Framework für die semantische 3D-Belegungsvorhersage, das durch eine LiDAR-initialisierte 3D-Gauß-Methode und einen LiDAR-gesteuerten deformierbaren Aufmerksamkeitsmechanismus im Vergleich zu herkömmlichen Voxel-basierten Ansätzen eine state-of-the-art Genauigkeit bei gleichzeitig reduziertem Speicherbedarf und höherer Effizienz erreicht.