DuplexCascade: Full-Duplex Speech-to-Speech Dialogue with VAD-Free Cascaded ASR-LLM-TTS Pipeline and Micro-Turn Optimization
O artigo apresenta o DuplexCascade, um pipeline cascata de fala para fala sem VAD que habilita diálogos em full-duplex com inteligência conversacional robusta, convertendo turnos longos em micro-turnos e utilizando tokens de controle especializados para coordenar a interação em tempo real.