ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models
O artigo apresenta o framework ORIC e o benchmark ORIC-Bench para avaliar e mitigar as falhas de reconhecimento de objetos em Modelos Visuais-Linguísticos de Grande Escala (LVLMs) causadas por incongruências contextuais, demonstrando que o ajuste fino com reforço visual em dados incongruentes melhora significativamente a robustez e reduz alucinações nesses modelos.