Questions beyond Pixels: Integrating Commonsense Knowledge in Visual Question Generation for Remote Sensing
Este artigo propõe o modelo KRSVQG, que integra conhecimento comum externo e legendagem de imagens para gerar perguntas ricas e diversificadas sobre imagens de sensoriamento remoto, superando as limitações dos métodos atuais baseados em templates e validado através de novos conjuntos de dados e avaliações humanas.