VisioMath: Benchmarking Figure-based Mathematical Reasoning in LMMs
Ce papier présente VisioMath, un nouveau benchmark de 1 800 problèmes mathématiques K-12 basé sur des diagrammes visuellement similaires, qui révèle les limites actuelles des modèles multimodaux dans le raisonnement comparatif fin et propose des stratégies d'alignement pour améliorer leur précision.