Beyond Global Similarity: Towards Fine-Grained, Multi-Condition Multimodal Retrieval
Este trabajo presenta MCMR, un nuevo benchmark a gran escala diseñado para evaluar la recuperación multimodal de alta precisión bajo múltiples condiciones interdependientes, demostrando que los reordenadores basados en modelos de lenguaje multimodal mejoran significativamente la coincidencia fina al verificar explícitamente la consistencia entre la consulta y los candidatos.