Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking
Il paper presenta TFM, un nuovo framework di attacco che sfrutta la vulnerabilità temporale dei modelli text-to-video inserendo solo condizioni di confine sparse (due fotogrammi) per indurre il modello a generare autonomamente contenuti dannosi, aggirando così i filtri di sicurezza tradizionali.