From Intuition to Investigation: A Tool-Augmented Reasoning MLLM Framework for Generalizable Face Anti-Spoofing
Il paper propone TAR-FAS, un framework di ragionamento potenziato da strumenti per MLLM che migliora la generalizzabilità nel rilevamento di spoofing facciale trasformando il compito in un processo di indagine a catena di pensiero che combina intuizione semantica con l'uso adattivo di strumenti visivi esterni per analizzare pattern sottili.