A dataset of medication images with instance segmentation masks for preventing adverse drug events

该论文提出了名为 MEDISEG 的数据集,通过提供涵盖 32 种药片及 8262 张图像(包括重叠、遮挡等复杂场景)的实例分割标注,有效解决了现有药片识别数据集缺乏真实世界复杂性的问题,并验证了其在提升药物错误预防 AI 模型性能及少样本泛化能力方面的显著价值。

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

BALD-SAM: Disagreement-based Active Prompting in Interactive Segmentation

本文提出了 BALD-SAM 框架,通过将贝叶斯主动学习中的分歧(BALD)策略适配到空间提示选择中,利用冻结的大模型结合轻量级预测头来量化认知不确定性,从而在交互式分割中自动定位最具信息量的区域进行提示,在跨领域基准测试中显著优于现有方法及人类标注。

Prithwijit Chowdhury, Mohit Prabhushankar, Ghassan AlRegib2026-03-12🤖 cs.AI

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

该论文针对多模态大语言模型在长上下文场景中因视觉 token 注意力随文本序列增长而衰减(即“视觉淡化”)的问题,提出了一种基于模态交互解耦的模态间距离不变位置编码(DIPE)方法,通过保留模态内相对位置并固定模态间感知邻近性,有效消除了模态间距离带来的惩罚,从而显著提升了模型在长上下文中的视觉 grounding 能力。

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Bridging the Skill Gap in Clinical CBCT Interpretation with CBCTRepD

本文提出了名为 CBCTRepD 的双语口腔颌面 CBCT 报告生成系统,该系统基于大规模高质量配对数据构建,并通过临床验证证明其不仅能生成达到中级放射科医生水平的报告草稿,还能在放射科医生与 AI 协作中显著提升不同经验水平医生的诊断质量并减少漏诊。

Qinxin Wu, Fucheng Niu, Hengchuan Zhu, Yifan Sun, Ye Shen, Xu Li, Han Wu, Leqi Liu, Zhiwen Pan, Zuozhu Liu, Fudong Zhu, Bin Feng2026-03-12💻 cs

Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI

本文提出了 Med-DualLoRA,一种面向 3D 心脏 MRI 疾病检测的客户端感知参数高效联邦微调框架,通过解耦全局共享与本地低秩适应模块,在保护数据隐私的同时显著提升了多中心异构场景下的模型性能并降低了通信开销。

Joan Perramon-Llussà, Amelia Jiménez-Sánchez, Grzegorz Skorupko, Fotis Avgoustidis, Carlos Martín-Isla, Karim Lekadir, Polyxeni Gkontra2026-03-12💻 cs