Privacy-Preserving End-to-End Full-Duplex Speech Dialogue Models
Diese Studie zeigt, dass die versteckten Zustände end-to-end Full-Duplex-Sprachmodelle wie SALM-Duplex und Moshi erhebliche Privatsphärenrisiken für die Sprecheridentität bergen, und demonstriert, dass vorgeschlagene Streaming-Anonymisierungsmethoden diese Lecks signifikant reduzieren können, ohne dabei die Antwortlatenz oder die Sprachqualität zu beeinträchtigen.