SEMamba++: A General Speech Restoration Framework Leveraging Global, Local, and Periodic Spectral Patterns
Le papier présente SEMamba++, un cadre général de restauration de la parole qui améliore les performances tout en restant efficace sur le plan computationnel en intégrant des biais inductifs spécifiques à la parole, notamment via une extraction de caractéristiques fréquentielles (Frequency GLP) et un traitement dual temps-fréquence multi-résolution pour capturer les motifs spectraux globaux, locaux et périodiques.