R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment
Il paper propone R4-CGQA, un framework basato sul recupero di informazioni che potenzia i modelli Vision Language Model per la valutazione della qualità delle immagini di computer grafica, affrontando la carenza di dataset descrittivi e migliorando la capacità di fornire spiegazioni testuali accurate attraverso l'analisi di sei dimensioni percettive chiave.