cs.LG 篇论文 | Gist.Science

Hybrid Quantum Neural Network for Multivariate Clinical Time Series Forecasting

本文提出了一种将变分量子电路集成到循环神经网络骨干中的混合量子 - 经典架构，用于多变量临床生理时间序列的多步预测，并在 BIDMC 数据集上验证了其在小样本临床场景中相比传统方法具有更具竞争力的精度、更强的抗噪性及对缺失输入的鲁棒性。

Irene Iele, Floriano Caprio, Paolo Soda, Matteo Tortora2026-03-10🤖 cs.LG

Tiny Autoregressive Recursive Models

本文提出并评估了自回归递归模型（Autoregressive TRM），通过受控实验发现，尽管两阶段细化机制在特定基线中表现优异，但完整的自回归 TRM 架构并未带来可靠的性能提升，因此不建议将其作为主要的研究方向。

Paulius Rauba, Claudio Fanconi, Mihaela van der Schaar2026-03-10🤖 cs.LG

EAGLE-Pangu: Accelerator-Safe Tree Speculative Decoding on Ascend NPUs

本文提出了 EAGLE-Pangu 系统，通过将 EAGLE-3 风格的树形推测解码适配至昇腾 NPU 上的盘古模型，利用显式缓存管理、加速器安全的张量化及融合内核验证路径，在确保可复现性的同时显著提升了端到端解码吞吐量。

Chang Han, Yijie Hu, Jingling Liu2026-03-10🤖 cs.LG

DC-W2S: Dual-Consensus Weak-to-Strong Training for Reliable Process Reward Modeling in Biological Reasoning

该论文提出了 DC-W2S 框架，通过结合自一致性指标与嵌入空间邻域一致性指标来筛选高可靠性监督信号，并采用课程学习策略，实现了在无需大量专家标注的情况下利用含噪弱监督数据训练出可靠的生物推理过程奖励模型。

Chi-Min Chan, Ehsan Hajiramezanali, Xiner Li, Edward De Brouwer, Carl Edwards, Wei Xue, Sirui Han, Yike Guo, Gabriele Scalia2026-03-10🤖 cs.LG

Invisible Safety Threat: Malicious Finetuning for LLM via Steganography

该论文揭示了一种利用隐写术对大语言模型进行恶意微调的新型安全威胁，使模型能在表面呈现完全无害的交互时， covertly 生成并输出被隐藏的真实恶意内容，且该攻击能绕过现有安全检测机制。

Guangnian Wan, Xinyin Ma, Gongfan Fang, Xinchao Wang2026-03-10🤖 cs.LG

Tau-BNO: Brain Neural Operator for Tau Transport Model

本文提出了 Tau-BNO，一种基于脑神经算子的代理框架，旨在通过结合反应动力学与方向性输运机制，快速且高精度地近似阿尔茨海默病中 Tau 蛋白传播的复杂生物物理模型，从而克服传统数值模拟计算缓慢的瓶颈并加速机制发现。

Nuutti Barron, Heng Rao, Urmi Saha, Yu Gu, Zhenghao Liu, Ge Yu, Defu Yang, Ashish Raj, Minghan Chen2026-03-10🤖 cs.LG

Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting

该论文针对现有基于模型的离线强化学习方法（如 RAMBO）中存在的模型利用过度保守和梯度爆炸问题，提出了一种名为 ROMI 的新方法，通过引入鲁棒价值感知模型学习与隐式可微自适应加权机制，实现了可控的保守性与稳定的模型更新，从而在多个基准数据集上显著提升了性能。

Zhongjian Qiao, Jiafei Lyu, Boxiang Lyu, Yao Shu, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

SaiVLA-0: Cerebrum--Pons--Cerebellum Tripartite Architecture for Compute-Aware Vision-Language-Action

SaiVLA-0 提出了一种受神经科学启发的“大脑 - 脑桥 - 小脑”三分架构，通过冻结的高层多模态先验、实时意图整合适配器及并行快速控制解码器，实现了计算感知、模块化且高效的视觉 - 语言 - 动作系统，并在 LIBERO 基准测试中显著提升了训练效率与任务成功率。

Xiang Shi, Wenlong Huang, Menglin Zou, Xinhai Sun2026-03-10🤖 cs.LG

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

本文提出了 FoleyFlow，一种通过掩码建模训练实现音视频语义与节奏对齐，并利用动态条件流框架基于视频特征生成协调音频的新方法，其在基准测试中显著超越了现有成果。

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

该论文提出了一种名为 TRIAGE 的轻量级后处理框架，通过将不确定性分解为源于观测噪声的偶然性不确定性和源于模型失配的认知不确定性，并据此分别触发观测恢复、控制调节及感知模型容量选择等针对性响应，从而在机器人操作和自适应感知任务中显著提升了系统性能与效率。

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

该论文提出了一种仅利用健康数据、基于贝叶斯视角的概率异常检测方法，通过量化不确定性并提供可解释性工具，在直升机传动系统等安全关键场景中实现了具有竞争力的故障检测与预警性能。

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

本文提出了 SAGAD 框架，通过预计算多跳嵌入、重参数化切比雪夫滤波器以及自适应融合机制，有效解决了图异常检测中存在的同质性差异和可扩展性难题，实现了在大规模图上的高效训练与高精度检测。

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

本文提出了无需重新训练的推理时方法 DARC，通过将响应选择建模为分布鲁棒且风险敏感的决策过程，利用 KL 鲁棒满意度目标在存在异质偏好分歧的情况下有效降低尾部风险并维持平均质量。

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

该论文介绍了基于 JAX 的 Eventax 框架，它通过结合可微分数值 ODE 求解器与事件处理机制，在支持任意 ODE 定义的神经元模型灵活性的同时，实现了无需近似梯度的精确梯度训练，从而解决了现有脉冲神经网络训练框架在模型灵活性与梯度准确性之间的权衡难题。

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

该论文通过严格理论分析揭示了分类器自由引导（CFG）中固定权重策略的局限性，并据此提出了一种无需训练、即插即用的控制分类器自由引导（C²FG）方法，通过指数衰减控制函数动态调整引导强度以匹配扩散过程，从而在多种生成任务中显著提升了效果。

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

本文批判了当前长时序预测领域过度依赖均方误差等聚合指标进行基准排名而忽视实际决策价值的现状，主张构建融合统计保真度、结构一致性与决策相关性的多维评估体系，以引导研究从单纯追求榜单分数转向解决具有实际意义的预测问题。

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

本文提出了一种基于迭代重加权最小二乘框架的鲁棒自协方差最小二乘估计方法（ALS-IRLS），通过创新级自适应阈值筛选与基于 Huber 代价函数的迭代加权策略，显著提升了卡尔曼滤波器在含异常值数据下的噪声协方差估计精度及状态估计性能。

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

本文提出了 TIER 方法，通过构建隐式层次分类体系并将其融入表示学习过程，有效解决了文本丰富网络中忽视内在层次语义的问题，从而实现了更具可解释性和结构化的节点表征。

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

该论文介绍了 Covenant-72B，这是首个利用区块链协议实现完全开放、无需许可的参与，并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型，证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

该论文研究表明，在连续潜在空间中进行推理（Continuous Chain-of-Thought）相比传统的显式思维链，在低资源语言的零样本场景下具有更强的鲁棒性和语言不变性，同时能将推理过程压缩 29 至 50 倍，为跨语言推理提供了可扩展的高效解决方案。

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

cs.LG