ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors
Il paper presenta ArtHOI, il primo framework zero-shot che sintetizza interazioni umane con oggetti articolati fisicamente plausibili formulando il problema come una ricostruzione 4D da video monoculari generati da modelli di diffusione, superando i limiti delle approcci precedenti basati su oggetti rigidi.