ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

该论文提出了 ParaS2S 框架,通过构建 ParaS2SBench 基准、设计抗风格幻觉的多阶段自动评估器以及采用强化学习策略,有效解决了现有语音到语音模型在情感、语调等副语言线索感知与响应方面的不足,显著提升了对话内容与风格的适配性。

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

该研究提出了一种融合 MGWR、随机森林和时空图卷积网络的 GeoAI 混合分析框架,通过实证分析揭示了土地利用与多模式交通流之间复杂的空间异质性相互作用,显著提升了预测精度并识别出五种功能各异的交通类型,为制定基于证据的多模态交通管理和土地利用政策提供了可解释的工具。

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

本文通过分析 ISAC 系统中基于信道状态信息的电磁逆散射问题的病态性根源,提出了一种结合线性采样法与约束子空间二次规划的 ROI 受限重建框架,有效改善了矩阵条件数并显著提升了材料重构的鲁棒性与计算效率。

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

本文针对可重构智能表面辅助的上中频段 MIMO 系统中因近场传播和过渡散射导致的信道估计病态难题,提出了一种无需稀疏假设的“条件感知”估计框架,通过贪婪列分组和分段 RIS 相位设计将高维病态问题转化为多个良态子问题,从而在低导频开销下显著提升了估计性能。

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

本文提出了一种融合检索与学习的统一指纹定位框架,通过信道绘图将高维信道状态信息映射至低维潜在空间以实现高效检索,并借助图注意力网络显式建模查询点与参考点间的关联,从而在复杂场景下显著提升了无线定位的精度与可扩展性。

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

该论文提出了 MAD(多模态情感数据集),这是一个包含同步采集的多种生理信号(如 EEG、ECG 等)与三视角 RGB-D 面部视频、并采用涵盖刺激诱发、主观认知及行为表达三级情感标注框架的多模态情感数据集,旨在为情感计算与神经生理建模提供可靠的多层次基准资源。

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess