AG-VAS: Anchor-Guided Zero-Shot Visual Anomaly Segmentation with Large Multimodal Models
El paper presenta AG-VAS, un marco de segmentación de anomalías visuales sin ejemplos que aprovecha modelos multimodales grandes mediante tokens de anclaje semántico aprendibles y una alineación cruzada mejorada para lograr un rendimiento superior en la detección de anomalías en escenarios de ceros ejemplos.