Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models
Este trabalho introduz o framework "Informativeness" e um novo conjunto de dados específico para o setor de hospitalidade a fim de avaliar a capacidade de Modelos Visuais-Linguísticos (VLMs) em fornecer informações úteis para a tomada de decisão, revelando que, embora esses modelos necessitem de ajuste fino específico para o domínio, eles podem se tornar eficazes ao identificar sinais visuais-chave para necessidades informativas dos usuários.