HARP: HARmonizing in-vivo diffusion MRI using Phantom-only training

该论文提出了一种名为 HARP 的深度学习框架,通过仅在可移动的扩散体模上进行训练,成功消除了多站点体内扩散 MRI 数据间的扫描仪差异,从而无需依赖复杂且难以获取的多站点人体受试者队列即可实现数据标准化。

Hwihun Jeong, Qiang Liu, Kathryn E. Keenan, Elisabeth A. Wilde, Walter Schneider, Sudhir Pathak, Anthony Zuccolotto, Lauren J. O'Donnell, Lipeng Ning, Yogesh Rathi2026-03-10💻 cs

Thinking with Gaze: Sequential Eye-Tracking as Visual Reasoning Supervision for Medical VLMs

该论文提出利用眼动追踪数据作为监督信号,通过引入专用的注视令牌引导医学视觉语言模型按时间顺序模拟放射科医生的视觉搜索过程,从而显著提升了模型在医学影像推理任务中的性能与泛化能力。

Yiwei Li, Zihao Wu, Yanjun Lv, Hanqi Jiang, Weihang You, Zhengliang Liu, Dajiang Zhu, Xiang Li, Quanzheng Li, Tianming Liu, Lin Zhao2026-03-10💻 cs

SIQA: Toward Reliable Scientific Image Quality Assessment

该论文提出了科学图像质量评估(SIQA)框架,通过构建包含知识(科学有效性与完整性)和感知(认知清晰度与学科规范性)的双维评估体系及 SIQA 挑战基准,揭示了现有多模态大模型在科学图像评分一致性上表现良好但科学理解能力不足的差距,从而强调了多维评估对于科学图像质量判断的必要性。

Wenzhe Li, Liang Chen, Junying Wang, Yijing Guo, Ye Shen, Farong Wen, Chunyi Li, Zicheng Zhang, Guangtao Zhai2026-03-10💻 cs

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

该论文揭示了一种长程视觉语言模型的行为规律,即模型在推理过程中保持与视觉状态一致的时间锚定能力(通过步级接地率 SGR 衡量),是预测其分布外泛化性能的关键指标,且该能力独立于模型规模和最终答案准确率。

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs