LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models
Ce papier présente LLaVAShield, un cadre de sécurité conçu pour auditer les dialogues multimodaux multi-tours dans les modèles vision-langage, accompagné du jeu de données MMDS et de la méthode MMRT pour générer et évaluer des risques complexes que les approches traditionnelles ne peuvent pas détecter.