Revisiting Global Token Mixing in Task-Dependent MRI Restoration: Insights from Minimal Gated CNN Baselines

该论文通过构建受控基准测试,揭示了全局 Token 混合机制在 MRI 恢复任务中的效用具有任务依赖性:在物理约束较强的重建和超分辨率任务中,轻量级局部门控 CNN 已具备竞争力,而仅在存在显著空间异方差噪声的去噪任务中,全局 Token 混合模型才展现出显著优势。

Xiangjian Hou, Chao Qin, Chang Ni + 3 more2026-03-03⚡ eess

Deepfake Forensics Adapter: A Dual-Stream Network for Generalizable Deepfake Detection

本文提出了名为 Deepfake Forensics Adapter (DFA) 的新型双流网络框架,该框架通过冻结预训练 CLIP 模型参数并集成全局特征适配器、局部异常流及交互融合分类器,在无需微调基础模型的情况下显著提升了深度伪造检测的泛化能力,并在 DFDC 等基准测试中取得了最先进的性能表现。

Jianfeng Liao, Yichen Wei, Raymond Chan Ching Bon + 3 more2026-03-03💻 cs

WildCross: A Cross-Modal Large Scale Benchmark for Place Recognition and Metric Depth Estimation in Natural Environments

本文提出了 WildCross,这是一个包含超过 47.6 万帧序列 RGB 图像、半稠密深度与法线标注及精确 6DoF 位姿的大规模跨模态基准数据集,旨在解决现有数据集在结构化城市环境中占主导而缺乏非结构化自然环境数据的问题,从而推动机器人跨模态场景定位与度量深度估计技术的发展。

Joshua Knights, Joseph Reid, Kaushik Roy + 3 more2026-03-03💻 cs

SCATR: Mitigating New Instance Suppression in LiDAR-based Tracking-by-Attention via Second Chance Assignment and Track Query Dropout

本文提出了 SCATR 模型,通过引入“二次分配”和“轨迹查询丢弃”两种架构无关的训练策略,有效缓解了基于 LiDAR 的跟踪 - 注意力框架中的新实例抑制问题,从而在 nuScenes 基准上实现了最先进的性能并显著缩小了其与检测 - 跟踪方法的差距。

Brian Cheong, Letian Wang, Sandro Papais + 1 more2026-03-03💻 cs

Downstream Task Inspired Underwater Image Enhancement: A Perception-Aware Study from Dataset Construction to Network Design

该论文提出了一种受下游任务启发的水下图像增强(DTI-UIE)框架,通过构建任务驱动的数据集、设计双分支网络及任务感知损失函数,有效解决了现有方法忽视高频细节的问题,显著提升了水下图像在语义分割、目标检测等下游任务中的识别性能。

Bosen Lin, Feng Gao, Yanwei Yu + 2 more2026-03-03⚡ eess

Tiny-DroNeRF: Tiny Neural Radiance Fields aboard Federated Learning-enabled Nano-drones

本文提出了 Tiny-DroNeRF,这是一种专为资源受限的亚 30 克微型无人机设计的轻量化神经辐射场模型,它通过优化 Instant-NGP 架构使其能在超低功耗 MCU 上运行,并结合联邦学习方案在多台无人机间协同训练,从而在显著降低内存占用的同时实现了复杂环境下的密集 3D 场景重建。

Ilenia Carboni, Elia Cereda, Lorenzo Lamberti + 3 more2026-03-03⚡ eess

Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery

该论文提出了一种基于条件 CycleGAN 的混合类插值数据增强方法(C2GMA),通过利用可见光图像合成合成孔径雷达(SAR)域数据,有效解决了非可见光领域数据稀缺问题,并在冰山分类任务中将准确率提升至 75.4%,显著优于传统增强策略。

Hiroshi Sasaki, Chris G. Willcocks, Toby P. Breckon2026-03-02🤖 cs.LG