A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

该论文提出了一种面向医疗图像分类的首个自动审计框架,通过扩展多模态表示的切片发现方法,有效解决了现有单模态或元数据分析在可解释性及捕捉隐藏系统性故障方面的局限性,并在 MIMIC-CXR-JPG 数据集上验证了其在故障发现与解释生成方面的卓越能力。

Yixuan Liu, Kanwal K. Bhatia, Ahmed E. Fetit2026-03-02🤖 cs.LG

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

本文提出了名为 UMPIRE 的训练-free 不确定性量化框架,通过利用模型内部特征计算响应样本的“非一致性调整语义体积”,有效解决了多模态大语言模型在多种模态及分布外场景下现有不确定性指标受限的问题,显著提升了错误检测与校准性能。

Gregory Kang Ruey Lau, Hieu Dao, Nicole Kan Hui Lin + 1 more2026-03-02💬 cs.CL