C2^2FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

该论文通过严格理论分析揭示了分类器自由引导(CFG)中固定权重策略的局限性,并据此提出了一种无需训练、即插即用的控制分类器自由引导(C²FG)方法,通过指数衰减控制函数动态调整引导强度以匹配扩散过程,从而在多种生成任务中显著提升了效果。

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

该论文介绍了 Covenant-72B,这是首个利用区块链协议实现完全开放、无需许可的参与,并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型,证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

本文指出当前表格基础模型(如 TabPFN)的回归基准过度依赖均方误差等点估计指标,忽略了概率预测的评估,因此主张引入连续 ranked 概率分数(CRPS)等严格评分规则来评估分布回归,并强调需通过微调或提示技术来适配不同的评分规则以优化模型的归纳偏置。

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

该论文通过注意力头层面的机制可解释性分析,揭示了续写触发型越狱攻击的本质是模型内在续写倾向与安全对齐防御之间的竞争,并阐明了不同架构中安全关键注意力头的功能差异,为理解及提升大语言模型安全性提供了新的理论视角。

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

本文提出了一种具备“冷启动”能力的自适应机载磁异常导航架构,通过扩展卡尔曼滤波将物理模型与神经网络残差学习相结合,实现了无需离线校准或专用机动即可在飞行中实时补偿飞机磁干扰并达到与离线训练模型相当的导航精度。

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG