When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS
Die Studie zeigt, dass das LoRA-Fine-Tuning von LLM-basierten TTS-Systemen bei ausreichend vielfältigen Trainingsdaten die Sprachqualität, Sprecherähnlichkeit und das Signal-Rausch-Verhältnis signifikant verbessert und dabei die Grenzen gefrorener Basismodelle überwindet.