Hierarchical Refinement of Universal Multimodal Attacks on Vision-Language Models
Este artículo presenta la Ataque de Refinamiento Jerárquico (HRA), un marco de ataque universal multimodal para modelos de visión-idioma que supera las limitaciones de los ataques específicos de muestra mediante la optimización temporal de gradientes en imágenes y la jerarquización de la importancia textual para lograr una transferencia superior en diversas tareas.