PointAlign: Feature-Level Alignment Regularization for 3D Vision-Language Models
Il paper presenta PointAlign, un metodo innovativo di regolarizzazione per l'allineamento a livello di feature che migliora l'efficienza e la preservazione delle informazioni geometriche nei modelli 3D Vision-Language supervisionando esplicitamente i token intermedi delle nuvole di punti, ottenendo risultati significativamente superiori su compiti di classificazione e descrizione 3D.