FunnyNodules: A Customizable Medical Dataset Tailored for Evaluating Explainable AI

本文介绍了 FunnyNodules,这是一个完全参数化的合成医学图像数据集,通过生成具有可控视觉属性的抽象肺结节形状及明确的决策规则,旨在填补缺乏诊断推理标注的空白,从而为评估和开发能够像放射科医生一样基于正确理由进行推理的可解释人工智能(xAI)模型提供灵活且全面的基准。

Luisa Gallée, Yiheng Xiong, Meinrad Beer, Michael Götz2026-03-09💻 cs

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

该论文提出了 FireScope 框架及 FireScope-Bench 基准,通过结合视觉监督与强化学习的思维链推理机制,实现了跨大陆的高分辨率野火风险预测,显著提升了模型的泛化能力与可解释性。

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis

本文提出了 SyncMV4D,这是首个通过多视角联合扩散模型与扩散点对齐器,将视觉先验、运动动力学和多视角几何统一起来,从而同步生成多视角手物交互视频与高保真 4D 运动轨迹的模型,有效解决了现有方法在几何失真、运动不真实及泛化能力方面的局限。

Lingwei Dang, Zonghan Li, Juntong Li, Hongwen Zhang, Liang An, Yebin Liu, Qingyao Wu2026-03-09💻 cs

UniTS: Unified Spatio-Temporal Generative Model for Remote Sensing

本文提出了名为 UniTS 的统一时空生成模型,该模型基于流匹配范式,通过自适应条件注入器和时空感知调制器,将遥感领域的时间序列重建、去云、语义变化检测及预测等多个核心任务整合到一个通用框架中,并在各种复杂条件下显著超越了现有的专用模型。

Yuxiang Zhang, Shunlin Liang, Wenyuan Li, Han Ma, Jianglei Xu, Yichuan Ma, Jiangwei Xie, Wei Li, Mengmeng Zhang, Ran Tao, Xiang-Gen Xia2026-03-09💻 cs

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

本文提出了 DFIR-DETR,一种通过动态内容特征聚合(DCFA)、动态特征金字塔网络(DFPN)和频域迭代细化模块(FIRC3)来分别解决注意力分配不均、上采样细节丢失及高频边缘平滑问题的 Transformer 检测器,在 NEU-DET 和 VisDrone 数据集上以轻量级架构实现了显著的小目标检测性能提升。

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

本文提出了一种针对 CT 影像的新型基于补丁的拓扑数据分析(TDA)方法,通过构建持久同调特征,在分类性能(如准确率、AUC 等指标平均提升 2.7% 至 8.0%)和计算效率上均显著优于传统的 3D 立方复形算法及放射组学特征,并发布了配套的 Python 工具包 Patch-TDA。

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark

本文提出了名为 Spatial4D-Bench 的大规模、多样化 4D 空间智能基准,旨在通过涵盖 18 种任务和 6 个认知类别的约 4 万组问答对,全面评估多模态大语言模型在 4D 空间推理方面的能力并揭示其当前局限性。

Pan Wang, Yang Liu, Guile Wu, Eduardo R. Corral-Soto, Chengjie Huang, Binbin Xu, Dongfeng Bai, Xu Yan, Yuan Ren, Xingxin Chen, Yizhe Wu, Tao Huang, Wenjun Wan, Xin Wu, Pei Zhou, Xuyang Dai, Kangbo Lv, Hongbo Zhang, Yosef Fried, Aixue Ye, Bailan Feng, Zhenyu Chen, Zhen Li, Yingcong Chen, Yiyi Liao, Bingbing Liu2026-03-09💻 cs