DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

本文提出了首个用于稀疏视图 CBCT 重建的基础模型 DeepSparse,通过引入融合多视角 2D 与多尺度 3D 特征的 DiCE 网络架构,以及结合混合视角采样预训练和两阶段微调的 HyViP 框架,有效解决了现有方法计算需求高和泛化能力差的问题,显著提升了重建质量并降低了辐射风险。

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng Li2026-03-10💻 cs

MTVCraft: Tokenizing 4D Motion for Arbitrary Character Animation

MTVCraft 是首个直接利用原始 3D 运动序列(4D 运动)进行角色图像动画生成的框架,通过 4D 运动分词器(4DMoT)和运动感知视频 DiT(MV-DiT)将运动量化为紧凑的 4D 令牌,从而在实现任意角色及物体零样本泛化动画的同时,显著提升了姿态引导视频生成的性能与灵活性。

Yanbo Ding, Xirui Hu, Zhizhi Guo, Yan Zhang, Xinrui Wang, Zhixiang He, Chi Zhang, Yali Wang, Xuelong Li2026-03-10💻 cs

Power flow and optimal power flow using quantum and digital annealers: a computational scalability analysis

本研究提出了将潮流(PF)和最优潮流(OPF)问题转化为二次无约束二值优化(QUBO)模型的 AQPF 和 AQOPF 算法,并通过在 D-Wave 量子退火器、混合求解器及富士通数字退火器上对 4 至 1354 节点系统的测试,验证了该方法在生成可行解及应对病态场景时的可扩展性与鲁棒性。

Zeynab Kaseb, Matthias Moller, Pedro P. Vergara, Peter Palensky2026-03-10💻 cs

Representing local protein environments with machine learning force fields

该研究提出了一种源自原子基础模型中间特征的新型局部蛋白质环境表示方法,该方法不仅能有效捕捉结构与化学特征,还能构建数据驱动的先验分布,并成功实现了具有物理学信息且达到最先进精度的核磁共振化学位移预测。

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. Bronstein2026-03-10💻 cs

Light of Normals: Unified Feature Representation for Universal Photometric Stereo

该论文提出了名为 LINO UniPS 的通用光度立体方法,通过引入光注册令牌与交错注意力机制实现光照与法线的有效解耦,结合小波双分支架构与法线梯度感知损失以保留高频几何细节,并借助大规模合成数据集 PS-Verse 及课程训练策略,在多个基准测试中取得了新的最先进性能。

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

本文提出了一种由视觉语言模型(VLM)引导的级联框架,通过利用 VLM 特征作为提示来指导 Segment Anything Model 进行精准分割,并将分割结果作为软空间先验保留全图上下文以消除域差距,从而有效解决了开放词汇伪装物体分割中的视觉模糊与未见类别分类难题。

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

该论文提出了一种名为查询自适应聚合(QAA)的新型特征聚合技术,通过利用学习到的查询作为参考码本,有效解决了多数据集联合训练中因数据差异导致的特征聚合容量受限问题,从而实现了在保持高性能的同时显著提升视觉地点识别模型在多样化数据集上的泛化能力。

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs