[b]=[d]-[t]+[p]: Self-supervised Speech Models Discover Phonological Vector Arithmetic
Questo studio dimostra che i modelli di linguaggio auto-supervisionati per l'elaborazione del parlato codificano le informazioni fonologiche attraverso vettori composizionali e interpretabili, permettendo operazioni aritmetiche vettoriali che riflettono le caratteristiche fonetiche e la loro realizzazione acustica in modo continuo.