Light of Normals: Unified Feature Representation for Universal Photometric Stereo

该论文提出了名为 LINO UniPS 的通用光度立体方法,通过引入光注册令牌与交错注意力机制实现光照与法线的有效解耦,结合小波双分支架构与法线梯度感知损失以保留高频几何细节,并借助大规模合成数据集 PS-Verse 及课程训练策略,在多个基准测试中取得了新的最先进性能。

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

本文提出了一种由视觉语言模型(VLM)引导的级联框架,通过利用 VLM 特征作为提示来指导 Segment Anything Model 进行精准分割,并将分割结果作为软空间先验保留全图上下文以消除域差距,从而有效解决了开放词汇伪装物体分割中的视觉模糊与未见类别分类难题。

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

该论文提出了一种名为查询自适应聚合(QAA)的新型特征聚合技术,通过利用学习到的查询作为参考码本,有效解决了多数据集联合训练中因数据差异导致的特征聚合容量受限问题,从而实现了在保持高性能的同时显著提升视觉地点识别模型在多样化数据集上的泛化能力。

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

本文提出了一种名为 MCULoRA 的鲁棒不完整多模态低秩适应框架,通过模态组合感知低秩适应(MCLA)模块解耦共享信息与模态特性,并利用动态参数微调(DPFT)模块基于表征空间可分性优化训练比例,从而有效解决了多模态情感识别中因模态缺失导致的梯度冲突问题并显著提升了预测性能。

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Unified Medical Image Segmentation with State Space Modeling Snake

本文提出了一种名为 Mamba Snake 的新型深度蛇形框架,通过引入状态空间建模、Mamba 演化模块及双分类协同机制,有效解决了统一医学图像分割中多尺度结构异质性与器官间关系建模的难题,并在五个临床数据集上实现了优于现有最先进方法的平均 3% 的 Dice 提升。

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs

π3\pi^3: Permutation-Equivariant Visual Geometry Learning

本文提出了π3π^3,一种无需固定参考视图、采用全排列等变架构的自监督前馈神经网络,通过直接预测仿射不变相机姿态和尺度不变局部点图,在相机位姿估计、单目/视频深度估计及稠密点云重建等任务中实现了最先进的性能。

Yifan Wang, Jianjun Zhou, Haoyi Zhu, Wenzheng Chang, Yang Zhou, Zizun Li, Junyi Chen, Jiangmiao Pang, Chunhua Shen, Tong He2026-03-10💻 cs

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

本文提出了一种结合神经形态相机与滚动机制的新型触觉传感器,利用事件驱动多视图立体视觉和贝叶斯融合策略,实现了在 0.5 m/s 高速下对大型工业表面进行亚毫米级精度的连续 3D 扫描,其速度比现有连续触觉传感方法快 11 倍。

Akram Khairi, Hussain Sajwani, Abdallah Mohammad Alkilany, Laith AbuAssi, Mohamad Halwani, Islam Mohamed Zaid, Ahmed Awadalla, Dewald Swart, Abdulla Ayyad, Yahya Zweiri2026-03-10💻 cs