Harnessing Chain-of-Thought Reasoning in Multimodal Large Language Models for Face Anti-Spoofing
Die vorgestellte Arbeit adressiert die mangelnde Generalisierungsfähigkeit herkömmlicher Methoden zur Gesichtserkennung von Spoofing-Angriffen, indem sie den ersten groß angelegten Visual-Question-Answering-Datensatz namens FaceCoT mit Chain-of-Thought-Annotationen sowie eine darauf aufbauende progressive Lernstrategie (CEPL) einführt, die Multimodal Large Language Models nutzt, um sowohl die Robustheit als auch die Interpretierbarkeit von Face Anti-Spoofing-Systemen signifikant zu verbessern.