cs.LG 篇论文 | Gist.Science

Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles

该论文表明，利用深度神经网络集成方法不仅能实现量子参数估计，还能有效量化估计不确定性并检测数据漂移，同时兼具比传统贝叶斯推断更快的推理速度，为实验场景下的实时参数估计提供了极具潜力的解决方案。

Amanuel Anteneh2026-03-09⚛️ quant-ph

Reasoned Safety Alignment: Ensuring Jailbreak Defense via Answer-Then-Check

该论文提出了名为“先答后查”（Answer-Then-Check）的新型安全对齐方法，通过构建包含 8 万样本的 ReSA 数据集训练模型在生成最终回复前进行推理与安全评估，从而在显著提升抗越狱能力、降低过度拒绝率的同时，保持了模型在通用推理任务上的性能。

Chentao Cao, Xiaojun Xu, Bo Han, Hang Li2026-03-09🤖 cs.AI

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

本文提出了 VEGA，一种结合物理信息神经算子（PINO）进行车辆参数估计与近端策略优化（PPO）进行充电感知路径规划的电动汽车导航系统，该系统在跨大陆路线上实现了比传统启发式算法快 20 倍以上的推理速度，并展现出对法国和日本路网的零样本泛化能力。

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space

本文提出了张量原子团簇展开（TACE）方法，通过在笛卡尔空间中利用不可约笛卡尔张量分解局部环境，统一了标量与张量建模，实现了无需克莱布希 - 高登系数的频域与空域高效计算，并展示了其在分子、材料、光谱、外场响应及多保真度训练等广泛场景中的高精度、稳定性与通用性。

Zemin Xu, Wenbo Xie, P. Hu2026-03-09🔬 cond-mat.mtrl-sci

C^2Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning

本文针对联邦持续学习中提示通信导致的类间知识不一致问题，提出了 C²Prompt 方法，通过引入局部类分布补偿机制和类感知提示聚合方案，有效缓解了类内分布差异与类间知识混淆，从而在多个基准测试中实现了最先进的性能。

Kunlun Xu, Yibo Feng, Jiangmeng Li, Yongsheng Qi, Jiahuan Zhou2026-03-09🤖 cs.LG

Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete

该论文提出了一种基于自回归 U-Net 和卷积神经网络的深度学习双网络架构，用于高效预测混凝土微观结构在收缩作用下的全场损伤演化及其力学性能，从而为优化混凝土配合比设计以提升耐久性提供新途径。

Liya Gaynutdinova, Petr Havlásek, Ondřej Rokoš, Fleur Hendriks, Martin Doškář2026-03-09🤖 cs.LG

Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds

本文提出了名为 GPHDM 的新方法，通过将高斯过程动力学模型扩展至双曲流形并结合分类学感知归纳偏置，实现了能够同时保留运动层级结构与时间动态、并生成物理一致轨迹的机器人拟人化运动生成。

Luis Augenstein, Noémie Jaquier, Tamim Asfour, Leonel Rozo2026-03-09🤖 cs.LG

Planner Aware Path Learning in Diffusion Language Models Training

该论文针对扩散语言模型中规划器导致的训练与推理不匹配问题，提出了理论证明并推导了新的规划证据下界（P-ELBO），进而设计了规划感知路径学习（PAPL）训练方案，通过简单修改损失函数实现了在蛋白质、文本和代码生成等多个领域的显著性能提升。

Fred Zhangzhi Peng, Zachary Bezemek, Jarrid Rector-Brooks, Shuibai Zhang, Anru R. Zhang, Michael Bronstein, Alexander Tong, Avishek Joey Bose2026-03-09🤖 cs.LG

Diffusion Alignment as Variational Expectation-Maximization

该论文提出了名为 DAV 的扩散模型对齐框架，将其形式化为交替进行测试时搜索（E 步）与模型微调（M 步）的变分期望最大化过程，从而在优化奖励的同时有效避免了奖励过拟合与模式崩溃，并成功应用于文本生成图像及 DNA 序列设计等连续与离散任务。

Jaewoo Lee, Minsu Kim, Sanghyeok Choi, Inhyuck Song, Sujin Yun, Hyeongyu Kang, Woocheol Shin, Taeyoung Yun, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.LG

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

本文针对弗里德金 - 约翰森模型中意见内禀值未知的在线场景，提出了一种基于低秩矩阵 bandit 的两阶段算法，通过子空间估计与线性 bandit 相结合，在仅观测标量反馈的情况下有效最小化了极化与分歧，并实现了理论保证的累积遗憾界。

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

该论文提出了一种名为“自投机掩码扩散”的新型离散数据生成模型，通过引入因果注意力机制和模型集成的投机采样策略，实现了非因子化的联合预测，从而在文本和蛋白质序列生成任务中将所需的网络前向传播次数减少了约一半。

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

本文提出了一种名为 TCR-EML 的可解释模型层，通过将基于已知 TCR-pMHC 结合机制的氨基酸残基接触原型嵌入蛋白质语言模型骨干，在保持预测竞争力的同时显著提升了 TCR-pMHC 结合预测的可解释性。

Jiarui Li, Zixiang Yin, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

该论文系统比较了仅编码器与仅解码器大语言模型在偏微分方程跨模态适应任务中的表现，发现未加改进的仅解码器模型效果远逊于仅编码器模型且无法通过单纯扩展规模提升，为此提出了“并行翻转”和“序列加倍”两种模拟双向性的新方法，成功缩小了两者性能差距并提升了所有任务的表现。

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

该论文通过引入元评估指标研究发现，现有的语言模型微基准测试方法在评估模型性能差异较小时（如 MMLU-Pro 上相差 3.5 个百分点）往往无法提供可靠的排序，且为了达到与随机采样相当的可靠性，通常需要多达 250 个样本，从而揭示了微基准测试在效率与可靠性之间的严峻权衡。

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

本文提出了 CanvasMAR，一种通过引入作为非均匀掩码的全局模糊“画布”先验、运动感知采样课程以及组合无分类器引导，从而在极少采样步数下实现高保真视频预测的自回归模型。

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

该论文通过理论分析与多领域实验证实，引入外部验证器（如人类或更优模型）来指导合成数据重训练，不仅能有效避免模型崩溃并带来短期性能提升，还能在长期将模型参数收敛至验证器的“知识中心”。

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

该论文提出了一种基于连续时间混合单调性技术的区间可达性分析方法，通过利用同胚性质和几何结构，在神经 ODE 验证中实现了计算效率与紧致性之间的有效权衡，特别适用于高维实时安全关键应用。

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

本文提出了一种基于改进滑动窗口汉克尔动态模态分解（Hankel-DMD）的实时在线框架，通过奇异值硬阈值去噪和结构低秩一致性投影，从部分含噪数据中构建动态障碍物的非线性预测模型，实现了稳定的方差感知去噪与短期轨迹预测，适用于机器人实时运动规划。

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

该论文提出了 KLASS（KL 引导自适应稳定采样）方法，通过利用令牌级 KL 散度识别高置信度预测并实现多令牌并行解掩，在无需额外训练的情况下显著加速了掩码扩散模型的推理过程，同时在文本、图像和分子生成等多个领域保持了甚至提升了生成质量。

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

该论文提出了一种针对分类数据聚类的簇定制自适应距离度量方法（CADM），通过根据各簇属性分布动态更新距离并扩展至混合数据，在多个数据集上取得了优异的聚类性能。

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG