DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models
DropVLA es un ataque de puerta trasera a nivel de acción que, mediante la inyección de datos enriquecidos con desencadenantes visuales, logra forzar la ejecución de primitivas de acción específicas en modelos de visión-idioma-acción con una tasa de éxito cercana al 100% y una retención de tareas limpias casi perfecta, incluso en entornos físicos reales.