Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection
Die Autoren stellen einen robusten Anpassungsrahmen für große multimodale Modelle vor, der durch Retrieval-Augmentation die Genauigkeit, Generalisierungsfähigkeit und Erklärbarkeit bei der Erkennung von Hass-Memes verbessert und dabei die Leistungsfähigkeit bestehender Methoden übertrifft.