Contrastive learning-based video quality assessment-jointed video vision transformer for video recognition
Este artículo propone SSL-V3, un modelo basado en aprendizaje auto-supervisado y transformadores de visión que integra la evaluación de calidad de video sin referencia para mejorar la clasificación de videos, demostrando una alta precisión en datasets de salud como I-CONECT al abordar la escasez de etiquetas de calidad.