VB: Visibility Benchmark for Visibility and Perspective Reasoning in Images
O artigo apresenta o VB, um novo benchmark que avalia a capacidade de modelos de visão e linguagem de determinar a visibilidade em imagens e abster-se quando necessário, utilizando edições mínimas controladas e métricas específicas para medir precisão, robustez e raciocínio de perspectiva.