Collaborative Multi-Modal Coding for High-Quality 3D Generation
Il paper presenta TriMM, il primo modello generativo feed-forward nativo 3D che sfrutta la codifica collaborativa multi-modale (RGB, RGBD e nuvole di punti) e la supervisione ausiliaria per generare asset 3D di alta qualità con dettagli geometrici e testurali superiori, dimostrando prestazioni competitive anche con dati di addestramento limitati.