Volumetric Directional Diffusion: Anchoring Uncertainty Quantification in Anatomical Consensus for Ambiguous Medical Image Segmentation

本文提出了一种名为体积定向扩散(VDD)的新方法,通过将生成轨迹锚定在确定性解剖共识先验上并仅预测 3D 边界残差场,有效解决了医学图像分割中多样性与保真度的权衡难题,从而在保持高精度分割的同时显著提升了不确定性量化能力并生成了符合解剖结构的置信度图。

Chao Wu, Kangxian Xie, Mingchen Gao2026-03-05🤖 cs.AI

DQE-CIR: Distinctive Query Embeddings through Learnable Attribute Weights and Target Relative Negative Sampling in Composed Image Retrieval

本文提出了 DQE-CIR 方法,通过引入可学习属性权重以强化文本引导的视觉特征对齐,并结合目标相对负采样策略从“中间地带”筛选高信息量负样本,从而有效解决现有组合图像检索方法中的相关性抑制与语义混淆问题,显著提升了细粒度属性修改场景下的查询判别力与检索精度。

Geon Park, Ji-Hoon Park, Seong-Whan Lee2026-03-05🤖 cs.AI

Long-Term Visual Localization in Dynamic Benthic Environments: A Dataset, Footprint-Based Ground Truth, and Visual Place Recognition Benchmark

本文针对动态海底环境中长期视觉定位研究缺乏基准数据集和精确真值的问题,首次发布了涵盖多站点及长达六年跨度的海底数据集,提出了一种基于图像足迹的三维真值构建方法,并据此对八种先进视觉位置识别算法进行了基准测试,揭示了现有方法在该场景下的性能局限及传统距离阈值评估法的不足。

Martin Kvisvik Larsen, Oscar Pizarro2026-03-05💻 cs

Revisiting the Role of Foundation Models in Cell-Level Histopathological Image Analysis under Small-Patch Constraints -- Effects of Training Data Scale and Blur Perturbations on CNNs and Vision Transformers

该研究通过系统评估发现,在细胞级(40x40 像素)小图块病理图像分析中,当训练数据规模充足时,针对小图块优化的任务特定架构(如 CustomViT)在准确性和效率上均优于基础模型,且基础模型并未展现出更强的模糊鲁棒性。

Hiroki Kagiyama, Toru Nagasaka, Yukari Adachi + 5 more2026-03-05💻 cs

TextBoost: Boosting Scene Text Fidelity in Ultra-low Bitrate Image Compression

本文提出了 TextBoost 方法,通过引入由 OCR 提取并作为辅助信息传输的文本语义引导,利用自适应过滤、注意力融合及正则化损失等策略,在超低比特率图像压缩中实现了小字体场景文本保真度与整体视觉质量的显著提升,有效解决了局部文本精度与全局图像质量之间的权衡难题。

Bingxin Wang, Yuan Lan, Zhaoyi Sun + 2 more2026-03-05💻 cs