NAU-QMUL: Utilizing BERT and CLIP for Multi-modal AI-Generated Image Detection
El artículo presenta un modelo multi-modal multi-tarea que combina BERT y CLIP con una estrategia de aumento de datos basada en pseudo-etiquetado para detectar imágenes generadas por IA y sus modelos creadores, logrando el quinto puesto en las tareas A y B del concurso CT2.