Bongard-RWR+: Real-World Representations of Fine-Grained Concepts in Bongard Problems
Este trabajo presenta Bongard-RWR+, un conjunto de datos ampliado de 5.400 instancias que utiliza imágenes generadas por modelos de lenguaje visuales para representar conceptos abstractos de problemas Bongard en escenarios realistas, demostrando que, aunque los modelos actuales reconocen conceptos visuales generales, siguen teniendo dificultades significativas para discernir conceptos finos y realizar razonamiento abstracto.