Underrepresented in Foundation Model Pretraining Data? A One-Shot Probe

该论文提出了一种仅需每类单张标注图像的高效方法,利用大语言模型生成反事实描述并结合线性回归,以极高相关性(Pearson-r 0.96)预测视觉 - 语言基础模型在包括非洲等代表性不足领域在内的各种目标域上的零样本准确率,从而为资源受限场景下的模型评估提供了低成本工具。

Chris Vorster, Mayug Maniparambil, Noel E. O'Connor + 2 more2026-03-05💻 cs

Leveraging Foundation Models for Content-Based Image Retrieval in Radiology

该研究提出利用视觉基础模型作为无需额外训练的通用特征提取器来构建医学影像内容检索系统,并通过在包含 160 万张影像的大规模数据集上的基准测试,证明了 BiomedCLIP 等弱监督模型在检索性能上可与专用系统媲美,从而展示了基础模型在推动放射学通用检索系统发展方面的巨大潜力。

Stefan Denner, David Zimmerer, Dimitrios Bounias + 8 more2026-03-04💻 cs