Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking
Este artículo presenta TFM, un marco de ataque temporal que explota la vulnerabilidad de los modelos de texto-a-video al rellenar trayectorias intermedias a partir de prompts fragmentados de dos marcos, logrando así evadir los filtros de seguridad y aumentar la tasa de éxito de las inyecciones de jailbreak.