Are Audio-Language Models Listening? Audio-Specialist Heads for Adaptive Audio Steering

该论文利用机械可解释性识别出大型音频语言模型中的“听觉”注意力头,并通过在推理阶段对最终表示进行激活干预(音频 - 静音导向),在不更新参数的情况下将模型在 MMAU 基准上的准确率提升了高达 8.0 个百分点,有效解决了模型过度依赖文本先验而忽视音频证据的问题。

Neta Glazer, Lenny Aharon, Ethan Fetaya2026-03-10💻 cs

Patch Validation in Automated Vulnerability Repair

该论文指出当前自动漏洞修复系统因忽略包含开发者意图和根因信息的增强测试(PoC+\text{PoC}^+)而高估了补丁有效性,为此构建了PVBench\text{PVBench}基准并发现超 40% 的“正确”补丁在增强测试下失效,进而提出修复工具需在根因分析、规范遵循及意图捕捉三方面进行改进。

Zheng Yu, Wenxuan Shi, Xinqian Sun, Zheyun Feng, Meng Xu, Xinyu Xing2026-03-10💻 cs

Distributed Legal Infrastructure for a Trustworthy Agentic Web

该论文针对人工智能代理主导的“代理网络”对现有法律框架带来的挑战,提出了一种由自主身份、认知约束、去中心化裁决、自下而上的市场规制及可移植制度框架五层构成的分布式法律基础设施(DLI)治理范式,旨在通过互操作协议将合法性嵌入技术底层,从而在去中心化环境中实现可问责、可争议且符合法治原则的治理。

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs