cs.LG 篇论文 | Gist.Science

Diffusion Language Models Are Natively Length-Aware

该论文提出了一种利用潜在提示表示零样本动态裁剪扩散语言模型上下文窗口的机制，从而在保持或提升性能的同时显著减少了推理所需的计算量。

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection

该论文针对现有时间序列异常检测评估指标在点级覆盖偏差、近漏报不敏感、误报惩罚不足及阈值依赖等方面存在的局限性，提出了一种基于检测语义的分区策略与全阈值谱聚合方法，构建了名为 DQE 的新型评估指标，以实现更稳定、判别力强且可解释的综合评估。

Yuewei Li, Dalin Zhang, Huan Li, Xinyi Gong, Hongjun Chu, Zhaohui Song2026-03-09🤖 cs.LG

Partial Policy Gradients for RL in LLMs

该论文提出了一种名为“部分策略梯度”的新方法，通过优化未来奖励的子集来构建不同复杂度的策略类（如贪婪、K 步前瞻等），从而在 Persona 对齐对话任务中实现更可靠的梯度估计与更优的策略选择。

Puneet Mathur, Branislav Kveton, Subhojyoti Mukherjee, Viet Dac Lai2026-03-09🤖 cs.AI

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

该论文证明了预测编码图（PCGs）在数学上是前馈人工神经网络（多层感知机）的超集，从而将预测编码网络更紧密地融入现代机器学习框架，并强化了对神经网络拓扑结构的研究。

Björn van Zwol2026-03-09🤖 cs.AI

Ensemble Graph Neural Networks for Probabilistic Sea Surface Temperature Forecasting via Input Perturbations

该研究提出了一种基于输入扰动（如分形 Perlin 噪声）的集成图神经网络方法，用于在无需额外训练成本的情况下，显著提升区域海温概率预报的校准度与不确定性表征能力。

Alejandro J. González-Santana, Giovanny A. Cuervo-Londoño, Javier Sánchez2026-03-09🤖 cs.AI

Efficient Vector Search in the Wild: One Model for Multi-K Queries

本文提出了 OMEGA，一种仅需在 K=1 上训练即可通过动态细化机制高效处理多 K 值向量搜索的通用模型，在显著降低预处理成本的同时实现了比现有最先进方法更低的延迟和同等召回率。

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo Chen2026-03-09🤖 cs.LG

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

该论文提出了一种两阶段框架，通过先在标注的人造字母表上训练对比学习教师模型，再利用蒸馏技术引导学生在无监督条件下学习历史文字系统的变形不变嵌入，从而在无需确切演化关系真值的情况下实现脚本相似性学习与聚类。

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

Random Quadratic Form on a Sphere: Synchronization by Common Noise

该论文提出了随机二次型（RQF）模型，通过研究其随机微分方程的不变测度和随机吸引子，揭示了在缺乏自注意力机制的情况下，由共同噪声驱动的深度 Transformer 中令牌仍能产生聚类同步行为的机理。

Maximilian Engel, Anna Shalova2026-03-09🤖 cs.LG

Topological descriptors of foot clearance gait dynamics improve differential diagnosis of Parkinsonism

该研究通过引入拓扑数据分析（TDA）提取步态中足部 clearance 的非线性结构特征，并结合随机森林分类器，显著提升了帕金森综合征（特别是特发性帕金森病与血管性帕金森病）的鉴别诊断准确率。

Jhonathan Barrios, Wolfram Erlhagen, Miguel F. Gago, Estela Bicho, Flora Ferreira2026-03-09🤖 cs.LG

FedSCS-XGB -- Federated Server-centric surrogate XGBoost for continual health monitoring

本文提出了一种名为 FedSCS-XGB 的联邦服务器中心代理 XGBoost 协议，用于基于可穿戴传感器数据的脊柱损伤患者持续健康监测，该协议在保持 XGBoost 核心结构优势的同时实现了分布式训练，其性能在理论分析和实证评估中均能接近集中式训练结果（差距小于 1%）。

Felix Walger, Mehdi Ejtehadi, Anke Schmeink, Diego Paez-Granados2026-03-09🤖 cs.LG

DC-Merge: Improving Model Merging with Directional Consistency

本文提出了 DC-Merge 方法，通过平滑奇异值以平衡任务向量的能量分布，并将其投影至共享正交子空间以校正方向几何不一致性，从而在模型合并中有效保留多任务知识，在视觉及视觉语言基准测试中实现了全微调与 LoRA 设置下的最先进性能。

Han-Chen Zhang, Zi-Hao Zhou, Mao-Lin Luo, Shimin Di, Min-Ling Zhang, Tong Wei2026-03-09🤖 cs.LG

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

该论文通过解析基于 softmax 的梯度流动力学，揭示了优化过程会内在驱动模型输出趋向低熵解，从而为 Transformer 中注意力集中和巨大激活等实证现象提供了理论解释。

Aditya Varre, Mark Rofin, Nicolas Flammarion2026-03-09🤖 cs.LG

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

本文提出了一种名为 SPPCSO 的自适应惩罚估计方法，通过结合单参数主成分回归与 $L_1$ 正则化，有效解决了高维相关数据中的多重共线性问题，在实现变量选择一致性的同时显著提升了模型在强噪声环境下的稳定性与预测精度。

Ying Hu, Hu Yang2026-03-09🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

该论文提出了合成监控环境（SMEs），这是一个具有无限连续控制任务、已知最优策略及可精确计算即时后悔值的标准化测试框架，旨在通过解耦环境复杂性因素，将强化学习评估从经验性基准测试转变为严谨的科学分析。

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

本文提出了一种基于有界非对称弹性网损失函数的鲁棒支持向量机（BAEN-SVM），通过理论证明其几何合理性、噪声鲁棒性及泛化能力，并设计了高效的半二次优化算法，实验表明该方法在含噪数据下的分类性能优于传统及先进的 SVM 模型。

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

本文提出了一种名为 DeCoST 的两阶段学习框架，通过解耦离散路径选择与连续服务时间分配，在求解带时间窗和可变利润的定向问题（OPTWVP）时，显著提升了求解质量与推理效率。

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

该研究通过评估 34 个大语言模型在放射学问答任务中的表现，发现引入基于检索的代理推理机制能显著降低模型间的决策离散度并增强跨模型的正确性鲁棒性，表明评估此类系统时不能仅依赖准确率或一致性，还需结合稳定性与潜在临床影响进行综合分析。

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

cs.LG