UNICBench: UNIfied Counting Benchmark for MLLM
El artículo presenta UNICBench, un conjunto de datos y herramienta de evaluación unificada que permite medir rigurosamente la capacidad de conteo de 45 modelos de lenguaje multimodales de última generación en imágenes, documentos y audio, revelando brechas significativas en tareas de razonamiento complejo.