Towards Highly Transferable Vision-Language Attack via Semantic-Augmented Dynamic Contrastive Interaction
Este trabajo propone SADCA, un ataque adversarial que mejora la transferibilidad en modelos de visión-lingüística mediante interacciones dinámicas contrastivas y aumento semántico para superar las limitaciones de los métodos existentes.