3DSPA: A 3D Semantic Point Autoencoder for Evaluating Video Realism
Il paper presenta 3DSPA, un autoencoder di punti semantici 3D che valuta automaticamente il realismo dei video generati dall'IA integrando traiettorie spaziotemporali, informazioni di profondità e caratteristiche semantiche per rilevare violazioni delle leggi fisiche e garantire coerenza temporale senza bisogno di un video di riferimento.