Gist.Science
OggiCercaPietre miliariInfoTestimonials
  • EN
  • NL
  • DE
  • FR
  • ES
  • 中文
  • 日本語
  • 한국어
  • PT
  • IT
💻 Category

cs.SD

163 articoli

ZeSTA: Zero-Shot TTS Augmentation with Domain-Conditioned Training for Data-Efficient Personalized Speech Synthesis

Il paper propone ZeSTA, un framework di addestramento condizionato al dominio che migliora la sintesi vocale personalizzata a risorse limitate utilizzando l'augmentazione Zero-Shot TTS senza compromettere la somiglianza del parlante.

Youngwon Choi, Jinwoo Oh, Hwayeon Kim + 1 more2026-03-05🤖 cs.AI

LabelBuddy: An Open Source Music and Audio Language Annotation Tagging Tool Using AI Assistance

Questo articolo presenta LabelBuddy, uno strumento open source di annotazione audio collaborativo che utilizza modelli di intelligenza artificiale e agenti autonomi per colmare il divario tra l'intento umano e la comprensione delle macchine, superando le limitazioni degli strumenti di tagging statici.

Ioannis Prokopiou, Ioannis Sina, Agisilaos Kounelis + 2 more2026-03-05🤖 cs.AI

Low-Resource Guidance for Controllable Latent Audio Diffusion

Il paper presenta un metodo a basso costo computazionale per il controllo di modelli di diffusione audio latente, basato su Latent-Control Heads (LatCH) e Selective TFG, che permette di regolare parametri come intensità, tono e battito senza richiedere un addestramento estensivo o costose retropropagazioni durante l'inferenza.

Zachary Novack, Zack Zukowski, CJ Carr + 6 more2026-03-05🤖 cs.AI
← Precedente

Ti è piaciuta questa spiegazione? Ricevine una così ogni giorno.

Controlla la tua casella di posta per confermare l'iscrizione.

Qualcosa è andato storto. Riprovare?

Niente spam, cancellati quando vuoi.

Gist.Science
InfoTestimonialsPrivacyContact

Grazie ad arXiv, bioRxiv e medRxiv per l'utilizzo della loro interoperabilità ad accesso aperto.

Gist.Science is a product of Bition B.V.
Verdunplein 17, 5627SZ Eindhoven
KvK: 95743731 | BTW-ID: NL867271966B01
mail@gist.science

Fatto nei Paesi Bassi 🇳🇱