Ramsa: A Large Sociolinguistically Rich Emirati Arabic Speech Corpus for ASR and TTS
Het artikel introduceert Ramsa, een zich ontwikkelende spraakcorpus van 41 uur met Emirati-Arabisch dat rijk is aan sociolinguïstische variatie en bedoeld is om onderzoek en technologieën voor automatisch spraakherkenning en tekst-naar-spraak te ondersteunen, waarbij de prestaties van bestaande modellen als uitgangspunt worden geëvalueerd.