UniTS: Unified Spatio-Temporal Generative Model for Remote Sensing

本文提出了名为 UniTS 的统一时空生成模型,该模型基于流匹配范式,通过自适应条件注入器和时空感知调制器,将遥感领域的时间序列重建、去云、语义变化检测及预测等多个核心任务整合到一个通用框架中,并在各种复杂条件下显著超越了现有的专用模型。

Yuxiang Zhang, Shunlin Liang, Wenyuan Li, Han Ma, Jianglei Xu, Yichuan Ma, Jiangwei Xie, Wei Li, Mengmeng Zhang, Ran Tao, Xiang-Gen Xia2026-03-09💻 cs

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

本文提出了 DFIR-DETR,一种通过动态内容特征聚合(DCFA)、动态特征金字塔网络(DFPN)和频域迭代细化模块(FIRC3)来分别解决注意力分配不均、上采样细节丢失及高频边缘平滑问题的 Transformer 检测器,在 NEU-DET 和 VisDrone 数据集上以轻量级架构实现了显著的小目标检测性能提升。

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

本文提出了一种针对 CT 影像的新型基于补丁的拓扑数据分析(TDA)方法,通过构建持久同调特征,在分类性能(如准确率、AUC 等指标平均提升 2.7% 至 8.0%)和计算效率上均显著优于传统的 3D 立方复形算法及放射组学特征,并发布了配套的 Python 工具包 Patch-TDA。

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark

本文提出了名为 Spatial4D-Bench 的大规模、多样化 4D 空间智能基准,旨在通过涵盖 18 种任务和 6 个认知类别的约 4 万组问答对,全面评估多模态大语言模型在 4D 空间推理方面的能力并揭示其当前局限性。

Pan Wang, Yang Liu, Guile Wu, Eduardo R. Corral-Soto, Chengjie Huang, Binbin Xu, Dongfeng Bai, Xu Yan, Yuan Ren, Xingxin Chen, Yizhe Wu, Tao Huang, Wenjun Wan, Xin Wu, Pei Zhou, Xuyang Dai, Kangbo Lv, Hongbo Zhang, Yosef Fried, Aixue Ye, Bailan Feng, Zhenyu Chen, Zhen Li, Yingcong Chen, Yiyi Liao, Bingbing Liu2026-03-09💻 cs

SRA 2: Variational Autoencoder Self-Representation Alignment for Efficient Diffusion Training

本文提出了 SRA 2,一种利用预训练 VAE 特征通过轻量级投影层对齐扩散 Transformer 中间潜在特征的内在指导框架,旨在无需外部编码器或双模型设置的情况下,显著加速扩散模型的训练收敛并提升生成质量。

Mengmeng Wang, Dengyang Jiang, Liuzhuozheng Li, Yucheng Lin, Guojiang Shen, Xiangjie Kong, Yong Liu, Guang Dai, Jingdong Wang2026-03-09💻 cs

SpatialReward: Bridging the Perception Gap in Online RL for Image Editing via Explicit Spatial Reasoning

本文提出了 SpatialReward,一种通过显式空间推理和像素级证据锚定来解决在线强化学习中“注意力坍塌”感知差距的奖励模型,该模型在多个基准测试中达到最先进水平,并显著提升了图像编辑模型 OmniGen2 的性能。

Yancheng Long, Yankai Yang, Hongyang Wei, Wei Chen, Tianke Zhang, Haonan fan, Changyi Liu, Kaiyu Jiang, Jiankang Chen, Kaiyu Tang, Bin Wen, Fan Yang, Tingting Gao, Han Li, Shuo Yang2026-03-09💻 cs