ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

该论文提出了 ParaS2S 框架,通过构建 ParaS2SBench 基准、设计抗风格幻觉的多阶段自动评估器以及采用强化学习策略,有效解决了现有语音到语音模型在情感、语调等副语言线索感知与响应方面的不足,显著提升了对话内容与风格的适配性。

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui Wu2026-03-09⚡ eess

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

本文通过分析 ISAC 系统中基于信道状态信息的电磁逆散射问题的病态性根源,提出了一种结合线性采样法与约束子空间二次规划的 ROI 受限重建框架,有效改善了矩阵条件数并显著提升了材料重构的鲁棒性与计算效率。

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki Ochiai2026-03-09⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

本文针对可重构智能表面辅助的上中频段 MIMO 系统中因近场传播和过渡散射导致的信道估计病态难题,提出了一种无需稀疏假设的“条件感知”估计框架,通过贪婪列分组和分段 RIS 相位设计将高维病态问题转化为多个良态子问题,从而在低导频开销下显著提升了估计性能。

Jeongjae Lee, Chanwon Kim, Songnam Hong2026-03-09⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

本文提出了一种融合检索与学习的统一指纹定位框架,通过信道绘图将高维信道状态信息映射至低维潜在空间以实现高效检索,并借助图注意力网络显式建模查询点与参考点间的关联,从而在复杂场景下显著提升了无线定位的精度与可扩展性。

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk Wymeersch2026-03-09⚡ eess

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

该论文提出了 MAD(多模态情感数据集),这是一个包含同步采集的多种生理信号(如 EEG、ECG 等)与三视角 RGB-D 面部视频、并采用涵盖刺激诱发、主观认知及行为表达三级情感标注框架的多模态情感数据集,旨在为情感计算与神经生理建模提供可靠的多层次基准资源。

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing Sun2026-03-09⚡ eess

Doctor or Patient? Synergizing Diarization and ASR for Code-Switched Hinglish Medical Conditions Extraction

该论文提出了一种结合端到端神经说话人分离(EEND-VC)与微调 Qwen3 ASR 模型的级联系统,用于从重叠严重的印地语 - 英语代码切换医疗对话中提取病症,并在 DISPLACE-M 挑战赛中凭借开源架构夺得第一名。

Séverin Baroudi, Yanis Labrak, Shashi Kumar, Joonas Kalda, Sergio Burdisso, Pawel Cyrta, Juan Ignacio Alvarez-Trejos, Petr Motlicek, Hervé Bredin, Ricard Marxer2026-03-09⚡ eess