Text-only adaptation in LLM-based ASR through text denoising

该论文提出了一种将文本域适应重构为文本去噪任务的轻量级新方法,通过训练大语言模型从噪声输入中恢复清晰转录,在无需修改架构或增加参数的情况下,有效解决了基于大语言模型的语音识别系统在仅使用文本数据适应新领域时跨模态对齐被破坏的问题,并显著提升了性能。

Andrés Carofilis, Sergio Burdisso, Esaú Villatoro-Tello, Shashi Kumar, Kadri Hacioglu, Srikanth Madikeri, Pradeep Rangappa, Manjunath K E, Petr Motlicek, Shankar Venkatesan, Andreas StolckeFri, 13 Ma⚡ eess

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

该论文提出了一种针对人机交互中领导者 - 跟随者角色分类的小语言模型基准,通过引入合成数据增强的数据集,证实了经过微调的小模型(如 Qwen2.5-0.5B)在零样本模式下能以低延迟实现高精度分类,优于提示工程方法,但在单样本模式下因上下文长度增加而面临性能下降的挑战。

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. LahrFri, 13 Ma⚡ eess

Can LLMs Help Localize Fake Words in Partially Fake Speech?

该论文探讨了利用基于文本训练的大语言模型构建语音模型以定位部分伪造语音中的篡改词汇,实验表明模型虽能利用训练数据中的编辑风格模式(如词汇极性替换)在特定场景下有效工作,但如何避免过度依赖这些特定模式并提升对未见编辑风格的泛化能力仍是待解决的开放性问题。

Lin Zhang, Thomas Thebaud, Zexin Cai, Sanjeev Khudanpur, Daniel Povey, Leibny Paola García-Perera, Matthew Wiesner, Nicholas AndrewsFri, 13 Ma⚡ eess

Self-Speculative Decoding for LLM-based ASR with CTC Encoder Drafts

该论文提出了一种利用 CTC 编码器作为草稿模型来加速自回归推理并提升自动语音识别(ASR)准确性的“自投机解码”方法,该方法在多个语料库和语言上实现了显著的速度提升,同时在 HuggingFace Open ASR 基准测试中取得了 5.58% 的优异词错率(WER)记录。

George Saon, Samuel Thomas, Takashi Fukuda, Tohru Nagano, Avihu Dekel, Luis LastrasFri, 13 Ma⚡ eess

Conduction-Diffusion in N-Dimensional settings as irreversible port-Hamiltonian systems

本文将不可逆端口哈密顿系统(IPHS)框架从一维推广至 N 维边界控制的分布参数系统,为描述传导 - 扩散流体现象提供了一个统一且热力学一致的建模方法,确保了全局能量平衡与熵产的正确表征,并为复杂多物理过程的系统建模、控制及结构保持数值离散奠定了基础。

Luis Mora, Yann Le Gorrec, Hector Ramirez, Denis MatignonFri, 13 Ma⚡ eess

Performance Bounds and Robust Filtering for LEO Inter-Satellite Synchronization under Cross-Epoch Doppler Coupling

本文针对低轨卫星链路中由跨历元多普勒耦合引起的同步难题,从理论上证明了该耦合机制对抑制载波相位不确定性的必要性,推导了包含块状信息结构的后验克拉美 - 罗界,并提出了一种结合硬门限与 Huber 估计的混合鲁棒滤波框架,显著降低了相位估计误差。

Haofan Dong, Houtianfu Wang, Hanlin Cai, Ozgur B. AkanFri, 13 Ma⚡ eess

Distributed Kalman--Consensus Filtering with Adaptive Uncertainty Weighting for Multi-Object Tracking in Mobile Robot Networks

本文提出了一种结合 MOTLEE 框架与自适应不确定性加权机制的分布式卡尔曼一致性滤波器,通过利用动态物体作为瞬态地标进行帧对齐并动态调整邻居信息权重,有效解决了移动机器人网络中因定位不确定性差异导致的轨迹不一致问题,显著提升了多目标跟踪性能。

Niusha Khosravi, Rodrigo Ventura, Meysam BasiriFri, 13 Ma⚡ eess