Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation
Il paper propone la Ricostruzione Contrastiva Diffusiva (DCR), un metodo che integra segnali contrastivi derivati dalle immagini ricostruite nel processo di diffusione per bilanciare la capacità discriminativa e la percezione dei dettagli, superando così i limiti degli encoder visivi CLIP.