BaltiVoice: A Speech Corpus and Fine-tuned Whisper ASR System for the Balti Language
Este artigo apresenta o BaltiVoice, o primeiro corpus de fala e modelo ASR Whisper ajustado finamente disponíveis publicamente para a língua Balti, o qual reduz significativamente as taxas de erro de palavra de uma linha de base zero-shot de 182,18% para 30,07% em um conjunto de dados de 16,8 horas derivado do Mozilla Common Voice.