The PARLO Dementia Corpus: A German Multi-Center Resource for Alzheimer's Disease

本文介绍了 PARLO 痴呆语料库(PDC),这是首个基于德国九家学术记忆诊所采集的、包含阿尔茨海默病相关轻度认知障碍及痴呆患者与健康对照者多模态数据的公开德语资源,旨在通过标准化神经心理学任务录音及其转录和临床元数据,推动基于语音的阿尔茨海默病非侵入性检测研究。

Franziska Braun, Christopher Witzl, Florian Hönig + 3 more2026-03-06⚡ eess

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

该论文提出了一种创新的多模态采集框架,首次实现了实时动态 MRI、脑电图(EEG)和表面肌电图(sEMG)的同步获取,并通过定制化的伪影抑制方案克服了技术挑战,从而为揭示言语产生的神经生理机制及推动脑机接口发展提供了前所未有的研究窗口。

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

本文研究了模型融合技术在多领域自动语音识别(ASR)中的应用潜力与局限,通过评估 11 种融合算法并提出了基于奇异值提升的 BoostedTSV-M 新算法,成功在单一模型中实现了优于全量微调的欧洲葡萄牙语领域性能,同时保持了良好的分布外泛化能力。

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL

Automated Measurement of Geniohyoid Muscle Thickness During Speech Using Deep Learning and Ultrasound

本文提出了一种名为 SMMA 的深度学习自动化框架,通过结合分割与骨架化技术实现了对言语过程中舌骨下肌群(geniohyoid)厚度的精准测量,不仅达到了接近人工标注的准确度,还揭示了粤语元音发音中的肌肉激活模式及性别差异,为大规模言语运动控制研究及吞咽障碍评估提供了可扩展的客观工具。

Alisher Myrgyyassov, Bruce Xiao Wang, Yu Sun + 4 more2026-03-05🤖 cs.LG

Multi-Stage Music Source Restoration with BandSplit-RoFormer Separation and HiFi++ GAN

本文介绍了 CP-JKU 团队为 ICASSP 2025 音乐源恢复挑战赛提出的系统,该系统通过结合采用三阶段课程学习策略的 BandSplit-RoFormer 分离模型与从通用专家演化为八个乐器特定专家的 HiFi++ GAN 波形恢复器,实现了从混音母带中高质量恢复原始乐器分轨的目标。

Tobias Morocutti, Emmanouil Karystinaios, Jonathan Greif + 1 more2026-03-05🤖 cs.LG