Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

该论文通过引入更广泛的模型配置和去污染的真实世界数据集,重新评估了 EVMBench 基准测试,发现 AI 智能体在智能合约安全审计中存在结果不稳定、无法独立完成端到端漏洞利用以及受脚手架影响显著等局限,从而挑战了全自动 AI 审计即将实现的乐观预期,并主张采用人机协同的审计工作流。

Chaoyuan Peng, Lei Wu, Yajin Zhou2026-03-12💻 cs

A dataset of medication images with instance segmentation masks for preventing adverse drug events

该论文提出了名为 MEDISEG 的数据集,通过提供涵盖 32 种药片及 8262 张图像(包括重叠、遮挡等复杂场景)的实例分割标注,有效解决了现有药片识别数据集缺乏真实世界复杂性的问题,并验证了其在提升药物错误预防 AI 模型性能及少样本泛化能力方面的显著价值。

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

OSUM-Pangu: An Open-Source Multidimension Speech Understanding Foundation Model Built upon OpenPangu on Ascend NPUs

本文介绍了 OSUM-Pangu,这是一个基于 OpenPangu-7B 大语言模型并在昇腾 NPU 全栈非 CUDA 环境下构建的开源多维语音理解基础模型,其通过分阶段训练策略实现了与主流 GPU 模型相当的任务准确率,为开源语音社区提供了可复现的非 CUDA 基准。

Yujie Liao, Xuelong Geng, Hongfei Xue, Shuiyuan Wang, Lei Xie2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

该论文针对多模态大语言模型在长上下文场景中因视觉 token 注意力随文本序列增长而衰减(即“视觉淡化”)的问题,提出了一种基于模态交互解耦的模态间距离不变位置编码(DIPE)方法,通过保留模态内相对位置并固定模态间感知邻近性,有效消除了模态间距离带来的惩罚,从而显著提升了模型在长上下文中的视觉 grounding 能力。

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

该研究通过对 81 名参与团队软件项目的学生进行四轮调查,发现开发者对文本消息的情感感知具有显著的个体内波动性和语句依赖性,且情绪特质与反应性等因素虽能微弱影响正面感知,但整体关联信号较弱,提示在解读情感分析结果时需警惕语境缺失带来的歧义。

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs

VoxCare: Studying Natural Communication Behaviors of Hospital Caregivers through Wearable Sensing of Egocentric Audio

本文介绍了 VoxCare 系统,该系统利用可穿戴设备在实时不存储原始音频的前提下,通过提取声学特征和语音基础模型指导的框架,对医院医护人员的自然沟通行为进行量化分析,从而揭示沟通模式与工作压力及负荷之间的关系,为优化医疗交付提供数据支持。

Tiantian Feng, Kleanthis Avramidis, Anfeng Xu, Deqi Wang, Brandon M Booth, Shrikanth Narayanan2026-03-12💻 cs