Compressed-Domain-Aware Online Video Super-Resolution

该论文提出了一种利用运动矢量、残差图和帧类型等压缩域信息的 CDA-VSR 网络,通过运动矢量引导的可变形对齐、残差门控融合及帧类型感知重建模块,在 REDS4 数据集上实现了比现有最先进方法 TMP 更高的重建质量(PSNR 提升 0.13 dB)和两倍以上的推理速度,从而解决了带宽受限场景下在线视频超分辨率实时处理的难题。

Yuhang Wang, Hai Li, Shujuan Hou, Zhetao Dong, Xiaoyao Yang2026-03-10💻 cs

Learning Context-Adaptive Motion Priors for Masked Motion Diffusion Models with Efficient Kinematic Attention Aggregation

本文提出了一种名为 Masked Motion Diffusion Model (MMDM) 的扩散生成框架,通过引入运动学注意力聚合机制学习上下文自适应运动先验,有效解决了视觉动作捕捉中的遮挡问题,实现了在动作细化、补全及插值等多种任务下的高效高质量 3D 运动重建。

Junkun Jiang, Jie Chen, Ho Yin Au, Jingyu Xiang2026-03-10💻 cs

PARSE: Part-Aware Relational Spatial Modeling

该论文提出了名为 PARSE 的框架,通过引入以部件为中心的装配图(PAG)和空间配置求解器来显式建模物体部件间的几何交互,并基于此构建了包含 10,000 个 3D 室内场景的 PARSE-10K 数据集,从而显著提升了视觉语言模型的布局推理能力以及 3D 场景生成的物理一致性与结构复杂性。

Yinuo Bai, Peijun Xu, Kuixiang Shao, Yuyang Jiao, Jingxuan Zhang, Kaixin Yao, Jiayuan Gu, Jingyi Yu2026-03-10💻 cs

3ViewSense: Spatial and Mental Perspective Reasoning from Orthographic Views in Vision-Language Models

本文针对视觉语言模型在空间推理任务中的“空间智能差距”,提出了名为 3ViewSense 的框架,通过引入基于正交视图的“模拟与推理”机制,将自我中心感知与外部参考对齐,从而显著提升了模型在遮挡计数和视角一致性推理等复杂空间任务中的表现。

Shaoxiong Zhan, Yanlin Lai, Zheng Liu, Hai Lin, Shen Li, Xiaodong Cai, Zijian Lin, Wen Huang, Hai-Tao Zheng2026-03-10💬 cs.CL

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

该论文提出了一种名为 DECADE 的无监督扩散模型,通过引入时间一致性约束,有效解决了铷 -82 动态心脏 PET 成像中因缺乏配对数据和高噪声导致的去噪难题,在提升图像质量的同时保持了血流动力学参数的定量准确性。

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

MedQ-Deg: A Multidimensional Benchmark for Evaluating MLLMs Across Medical Image Quality Degradations

本文提出了 MedQ-Deg 基准,通过涵盖 18 种退化类型、7 种成像模态及 30 个能力维度的大规模评估,揭示了当前医疗多模态大语言模型在图像质量退化下性能系统性下降且普遍存在“过度自信”的校准偏差问题。

Jiyao Liu, Junzhi Ning, Chenglong Ma, Wanying Qu, Jianghan Shen, Siqi Luo, Jinjie Wei, Jin Ye, Pengze Li, Tianbin Li, Jiashi Lin, Hongming Shan, Xinzhe Luo, Xiaohong Liu, Lihao Liu, Junjun He, Ningsheng Xu2026-03-10💻 cs

Geometric Knowledge-Assisted Federated Dual Knowledge Distillation Approach Towards Remote Sensing Satellite Imagery

该论文提出了一种几何知识引导的联邦双重知识蒸馏(GK-FedDKD)框架,通过利用局部协方差矩阵聚合生成全局几何知识来指导卫星遥感影像分析,有效解决了多卫星数据异构性挑战,并在 EuroSAT 等数据集上显著超越了现有最先进方法。

Luyao Zou, Fei Pan, Jueying Li, Yan Kyaw Tun, Apurba Adhikary, Zhu Han, Hayoung Oh2026-03-10💻 cs

Tracking Phenological Status and Ecological Interactions in a Hawaiian Cloud Forest Understory using Low-Cost Camera Traps and Visual Foundation Models

该研究通过在夏威夷云雾林部署低成本相机陷阱,结合视觉基础模型与传统计算机视觉技术,实现了对植物物候变化及动植物相互作用的细粒度监测,揭示了传统粗粒度采样难以发现的生态趋势。

Luke Meyers, Anirudh Potlapally, Yuyan Chen, Mike Long, Tanya Berger-Wolf, Hari Subramoni, Remi Megret, Daniel Rubenstein2026-03-10💻 cs