EmbedTalk: Triplane-Free Talking Head Synthesis using Embedding-Driven Gaussian Deformation
EmbedTalk introduceert een nieuwe methode voor realistische spraakgestuurde hoofdsynthese die tri-planes vervangt door leerbare embedding-driven Gaussische vervorming, wat resulteert in superieure kwaliteit en lip-sync bij een compactere modelgrootte en snelheden van meer dan 60 FPS op mobiele GPU's.