ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction
O artigo apresenta o ParaS2S, um novo framework de aprendizado por reforço que otimiza modelos de fala-para-fala para responder adequadamente a pistas paralinguísticas, apoiado pelo benchmark ParaS2SBench e por um avaliador automático escalável que supera os métodos tradicionais de ajuste fino supervisionado.