Disentangled Textual Priors for Diffusion-based Image Super-Resolution

本文提出了 DTPSR 框架,通过构建包含解耦全局与局部、低频与高频描述的大规模数据集 DisText-SR,并利用空间层级与频率语义双重解耦的文本先验及多分支引导策略,显著提升了基于扩散模型的图像超分辨率在语义可控性、细节还原度及泛化能力方面的表现。

Lei Jiang, Xin Liu, Xinze Tong, Zhiliang Li, Jie Liu, Jie Tang, Gangshan Wu2026-03-10💻 cs

Generalization in Online Reinforcement Learning for Mobile Agents

本文针对移动智能体在线强化学习中的泛化难题,提出了包含三种挑战模式的基准测试"AndroidWorld-Generalization"及一套集成 GRPO 算法的开源训练系统,实验表明该方法虽能显著提升模型在未见任务实例上的零样本泛化能力,但在未见模板和应用上的泛化效果仍有限,并初步验证了测试时少样本适应的潜力。

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

DogWeave 提出了一种基于模型的框架,通过扩散增强的法线场优化和结构风格引导的条件补全技术,仅从单张 RGB 图像即可重建出几何精确且纹理逼真的高保真 3D 犬类模型,有效解决了单目动物重建中因自遮挡和细节缺失导致的几何失真与纹理不一致问题。

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs

Selective Transfer Learning of Cross-Modality Distillation for Monocular 3D Object Detection

该论文针对单目 3D 目标检测中跨模态知识蒸馏因模态差异导致的负迁移问题,提出了名为 MonoSTL 的选择性学习方法,通过统一架构对齐及引入深度不确定性的特征与关系选择性蒸馏模块,有效实现了从 LiDAR 到图像网络的正向深度信息迁移,从而在多个基准数据集上显著提升了检测精度并达到最优性能。

Rui Ding, Meng Yang, Nanning Zheng2026-03-10💻 cs

Classifying Novel 3D-Printed Objects without Retraining: Towards Post-Production Automation in Additive Manufacturing

该论文提出了名为 ThingiPrint 的新数据集,并展示了一种利用 CAD 模型进行对比微调的无重训练分类方法,有效解决了工业增材制造中 3D 打印物体在无需重新训练模型的情况下实现自动分类的难题。

Fanis Mathioulakis, Gorjan Radevski, Silke GC Cleuren, Michel Janssens, Brecht Das, Koen Schauwaert, Tinne Tuytelaars2026-03-10💻 cs

RobustSCI: Beyond Reconstruction to Restoration for Snapshot Compressive Imaging under Real-World Degradations

该论文针对快照压缩成像(SCI)在真实世界退化场景下的局限性,提出了首个从“重建”转向“恢复”的研究框架,通过构建大规模基准数据集并设计包含多尺度去模糊与频域增强分支的 RobustSCI 网络及其级联版本,实现了在运动模糊和低光照等严重退化条件下的高质量视频恢复。

Hao Wang, Yuanfan Li, Qi Zhou, Zhankuo Xu, Jiong Ni, Xin Yuan2026-03-10💻 cs

AMR-CCR: Anchored Modular Retrieval for Continual Chinese Character Recognition

本文针对古汉字识别中非平稳的持续学习挑战,提出了 AMR-CCR 锚定模块化检索框架,通过共享多模态空间中的基于嵌入的字典匹配、脚本条件注入模块及多原型字典,实现了可扩展的增量学习与风格多样性建模,并构建了包含六个阶段的 EvoCON 基准数据集以支持系统评估。

Yuchuan Wu, Yinglian Zhu, Haiyang Yu, Ke Niu, Bin Li, Xiangyang Xue2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

本文通过利用 Tweedie 公式,精确揭示了漂移模型(Drifting)与基于分数的扩散模型之间的内在联系,证明了高斯核漂移等价于在平滑分布上进行分数匹配,并进一步推导了通用径向核的分解形式及拉普拉斯核在低温和高维情形下的误差界,从而为理解漂移模型与分布匹配蒸馏(DMD)提供了统一的理论视角。

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG