XPoint: A Self-Supervised Visual-State-Space based Architecture for Multispectral Image Registration

本文提出了 XPoint,一种基于自监督视觉状态空间架构的模块化多光谱图像配准框架,通过引入 VMamba 编码器与多任务解码头,有效解决了跨模态匹配中的非线性强度变化与标注数据稀缺问题,并在多种光谱组合任务中展现出优于或持平现有最先进方法的性能。

Ismail Can Yagmur, Hasan F. Ates, Bahadir K. Gunturk2026-03-03💻 cs

Polynomial, trigonometric, and tropical activations

本文提出了一种基于正交基(包括埃尔米特多项式、傅里叶三角函数及热带化多项式)的激活函数族,通过简单的方差保持初始化成功解决了深度模型中的激活与梯度爆炸/消失问题,实现了在 GPT-2 和 ConvNeXt 等大规模任务上的有效训练,并揭示了多项式激活网络的代数结构及其在微调任务中通过埃尔米特插值逼近经典激活函数的潜力。

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL