3DSPA: A 3D Semantic Point Autoencoder for Evaluating Video Realism
O artigo apresenta o 3DSPA, um autoencoder de pontos semânticos 3D que avalia automaticamente o realismo, a consistência temporal e a plausibilidade física de vídeos gerados por IA ao integrar trajetórias 3D, profundidade e características semânticas, superando métodos manuais e alinhando-se melhor aos julgamentos humanos.