Harnessing Chain-of-Thought Reasoning in Multimodal Large Language Models for Face Anti-Spoofing
Este artículo presenta FaceCoT, el primer conjunto de datos de preguntas y respuestas visuales a gran escala con razonamiento paso a paso para la detección de suplantación facial, junto con una estrategia de aprendizaje progresivo que mejora la generalización y la interpretabilidad de los modelos multimodales.