WSI-INR: Implicit Neural Representations for Lesion Segmentation in Whole-Slide Images

本文提出了基于隐式神经表示(INR)的 WSI-INR 框架,通过构建从空间坐标直接映射到组织语义的连续函数并引入多分辨率哈希网格编码,有效解决了传统补丁法破坏空间连续性的问题,实现了在保持跨分辨率鲁棒性的同时显著提升了对高度异质性病理病灶的分割性能。

Yunheng Wu, Wenqi Huang, Liangyi Wang + 4 more2026-03-05💻 cs

Seeing as Experts Do: A Knowledge-Augmented Agent for Open-Set Fine-Grained Visual Understanding

本文提出了知识增强的细粒度推理代理(KFRA),通过构建包含开放词汇检测、判别性区域定位及多模态证据整合的三阶段闭环推理机制,实现了在开放集条件下具备可解释性和事实依据的细粒度视觉理解,并在自建的 FGExpertBench 基准测试中显著超越了现有模型。

Junhan Chen, Zilu Zhou, Yujun Tong + 3 more2026-03-05💻 cs

Small Object Detection in Complex Backgrounds with Multi-Scale Attention and Global Relation Modeling

本文提出了一种面向复杂背景小目标检测的多级特征增强与全局关系建模框架,通过引入残差 Haar 小波下采样、全局关系建模、跨尺度混合注意力机制及中心辅助损失函数,有效解决了特征退化与定位不准问题,在 RGBT-Tiny 基准测试中显著优于现有最先进方法。

Wenguang Tao, Xiaotian Wang, Tian Yan + 2 more2026-03-05💻 cs

Structure-aware Prompt Adaptation from Seen to Unseen for Open-Vocabulary Compositional Zero-Shot Learning

本文提出了一种名为结构感知提示适应(SPA)的即插即用方法,通过利用语义相关概念在嵌入空间中的局部结构一致性,在训练阶段约束结构并推理阶段引导对齐,从而有效提升了开放词汇组合零样本学习(OV-CZSL)中从已知到未知属性及对象的泛化能力。

Yihang Duan, Jiong Wang, Pengpeng Zeng + 5 more2026-03-05💻 cs

All-in-One Image Restoration via Causal-Deconfounding Wavelet-Disentangled Prompt Network

针对现有全功能图像复原模型中语义特征与退化模式存在虚假关联及退化模式估计偏差的问题,本文提出了一种因果去混淆小波解耦提示网络(CWP-Net),通过编码器与解码器的小波注意力模块解耦特征,并利用小波提示块生成替代变量以消除偏差,从而在统一模型中实现了更优的通用图像复原效果。

Bingnan Wang, Bin Qin, Jiangmeng Li + 3 more2026-03-05💻 cs