Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking
Dit paper introduceert TFM, een aanvalsmethode die gebruikmaakt van een kwetsbaarheid in tekst-naar-video-modellen waarbij het specificeren van slechts begin- en eindframes leidt tot het genereren van schadelijke tussentijdse beelden, waardoor bestaande inhoudsfilters worden omzeild.