PA-Attack: Guiding Gray-Box Attacks on LVLM Vision Encoders with Prototypes and Attention
El artículo presenta PA-Attack, un método de ataque de caja gris para modelos visuales-lingüísticos de gran escala que utiliza guías de prototipos y un mecanismo de mejora de atención en dos etapas para lograr una alta eficiencia, generalización de tareas y una reducción significativa del rendimiento del modelo.