[b]=[d]-[t]+[p]: Self-supervised Speech Models Discover Phonological Vector Arithmetic
Cette étude démontre que les modèles de parole auto-supervisés encodent l'information phonétique sous forme de vecteurs interprétables et compositionnels, permettant d'effectuer des opérations arithmétiques vectorielles pour modéliser les traits phonologiques et leurs réalisations acoustiques continues à travers 96 langues.