Training-Free Multi-Step Inference for Target Speaker Extraction
Cet article propose une méthode d'inférence multi-étapes sans entraînement pour l'extraction de locuteur cible, qui affine itérativement la sortie d'un modèle pré-entraîné figé et introduit une optimisation conjointe de métriques pour équilibrer les performances avec ou sans vérité terrain.