OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models
이 논문은 MLLM 의 정밀한 시각적 불일치 감지 능력을 평가하기 위한 'OddGridBench' 벤치마크를 제안하고, 커리큘럼 학습과 거리 기반 보상을 결합한 강화학습 프레임워크 'OddGrid-GRPO' 를 통해 해당 능력을 획기적으로 향상시키는 방법을 제시합니다.