X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection
Dit paper introduceert X-AVDT, een robuuste deepfake-detectormethode die gebruikmaakt van audio-visuele kruisattentie-cues uit generatieve modellen via DDIM-inversie, en introduceert het nieuwe MMDF-dataset om de prestaties en generalisatievermogen van detectoren te verbeteren.