R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment
Die Arbeit stellt R4-CGQA vor, ein retrieval-basiertes Framework für Vision-Language-Modelle, das durch die Einführung eines neuen Datensatzes mit sechs Qualitätsdimensionen und einer zweistromigen Abrufarchitektur die Bewertung und textbasierte Erklärung der Bildqualität von Computergrafiken signifikant verbessert.