BaltiVoice: A Speech Corpus and Fine-tuned Whisper ASR System for the Balti Language
Este artículo presenta BaltiVoice, el primer corpus de voz y modelo ASR Whisper ajustado para el idioma Balti disponibles públicamente, lo cual reduce significativamente las tasas de error de palabra de un valor de referencia zero-shot del 182.18% al 30.07% en un conjunto de datos de 16.8 horas derivado de Mozilla Common Voice.