A Comprehensive Analysis of the Effects of Network Quality of Service on Robotic Telesurgery

该论文通过引入新型网络故障注入工具 NetFI 并结合包含 15 名受试者的用户研究,系统分析了丢包、延迟和通信中断等网络服务质量因素对不同熟练度外科医生执行远程手术任务性能、运动原语及主观工作负荷的具体影响,从而为确定远程手术的操作边界及开发鲁棒控制策略提供了量化依据。

Zhaomeng Zhang, Seyed Hamid Reza Roodabeh, Homa Alemzadeh2026-03-10💻 cs

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

该论文揭示了一种长程视觉语言模型的行为规律,即模型在推理过程中保持与视觉状态一致的时间锚定能力(通过步级接地率 SGR 衡量),是预测其分布外泛化性能的关键指标,且该能力独立于模型规模和最终答案准确率。

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

Are Audio-Language Models Listening? Audio-Specialist Heads for Adaptive Audio Steering

该论文利用机械可解释性识别出大型音频语言模型中的“听觉”注意力头,并通过在推理阶段对最终表示进行激活干预(音频 - 静音导向),在不更新参数的情况下将模型在 MMAU 基准上的准确率提升了高达 8.0 个百分点,有效解决了模型过度依赖文本先验而忽视音频证据的问题。

Neta Glazer, Lenny Aharon, Ethan Fetaya2026-03-10💻 cs

Patch Validation in Automated Vulnerability Repair

该论文指出当前自动漏洞修复系统因忽略包含开发者意图和根因信息的增强测试(PoC+\text{PoC}^+)而高估了补丁有效性,为此构建了PVBench\text{PVBench}基准并发现超 40% 的“正确”补丁在增强测试下失效,进而提出修复工具需在根因分析、规范遵循及意图捕捉三方面进行改进。

Zheng Yu, Wenxuan Shi, Xinqian Sun, Zheyun Feng, Meng Xu, Xinyu Xing2026-03-10💻 cs