R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment
Ce papier propose R4-CGQA, un cadre à deux flux basé sur la récupération qui améliore l'évaluation de la qualité des images de graphisme informatique par les modèles vision-langage en s'appuyant sur un nouveau jeu de données annoté et des descriptions visuellement similaires pour fournir des jugements précis et explicables.