Q-Save: Towards Scoring and Attribution for Generated Video Evaluation
이 논문은 생성된 비디오의 시각적 품질, 동적 품질, 텍스트 - 비디오 정합성이라는 세 가지 핵심 차원을 체계적으로 정의하고 통합적으로 평가하기 위해 약 10,000 개의 비디오 샘플과 세부적 귀속 설명이 포함된 Q-Save 데이터셋과 이를 기반으로 점수 예측과 해석 가능한 설명 생성을 동시에 수행하는 통합 모델을 제안합니다.