FOCA: Frequency-Oriented Cross-Domain Forgery Detection, Localization and Explanation via Multi-Modal Large Language Model
El artículo presenta FOCA, un marco basado en modelos de lenguaje grandes multimodales que integra características de los dominios espacial y frecuencial para mejorar la detección, localización y explicación interpretable de manipulaciones de imágenes, respaldado por el nuevo conjunto de datos FSE-Set.