FOCA: Frequency-Oriented Cross-Domain Forgery Detection, Localization and Explanation via Multi-Modal Large Language Model
Der Artikel stellt FOCA vor, ein multimodales Framework auf Basis von Large Language Models, das durch die Fusion von räumlichen und frequenzbasierten Merkmalen sowie die Einführung des Datensatzes FSE-Set eine präzise Bildfälschungserkennung, -lokalisierung und interpretierbare Erklärung übertrifft.