From Intuition to Investigation: A Tool-Augmented Reasoning MLLM Framework for Generalizable Face Anti-Spoofing
Este artículo presenta TAR-FAS, un marco de razonamiento potenciado por herramientas que utiliza un paradigma de cadena de pensamiento con herramientas visuales y el algoritmo DT-GRPO para superar las limitaciones de los métodos actuales de detección de suplantación facial, logrando un estado del arte en generalización cruzada mediante la investigación adaptativa de patrones visuales sutiles.