MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations
Este artículo presenta MuSaG, el primer conjunto de datos multimodal en alemán para la detección de sarcasmo, que incluye anotaciones humanas alineadas de texto, audio y video, y revela una brecha significativa entre el rendimiento de los modelos actuales (que dependen principalmente del texto) y el de los humanos (que se basan fuertemente en el audio), motivando así el desarrollo de sistemas más robustos para escenarios realistas.