Speech Synthesis from Electrocorticography during Imagined Speech Using a Transformer-Based Decoder and a Pretrained Vocoder
Cet article présente un cadre d'apprentissage utilisant un décodeur Transformer et un vocodeur préentraîné pour synthétiser la parole à partir de signaux ECoG lors de la parole imaginaire, en exploitant l'enregistrement audio de la parole à haute voix comme vérité terrain de substitution pour pallier l'absence de données synchronisées.