cs.LG 篇论文 | Gist.Science

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

该论文通过严格理论分析揭示了分类器自由引导（CFG）中固定权重策略的局限性，并据此提出了一种无需训练、即插即用的控制分类器自由引导（C²FG）方法，通过指数衰减控制函数动态调整引导强度以匹配扩散过程，从而在多种生成任务中显著提升了效果。

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

本文批判了当前长时序预测领域过度依赖均方误差等聚合指标进行基准排名而忽视实际决策价值的现状，主张构建融合统计保真度、结构一致性与决策相关性的多维评估体系，以引导研究从单纯追求榜单分数转向解决具有实际意义的预测问题。

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

本文提出了一种基于迭代重加权最小二乘框架的鲁棒自协方差最小二乘估计方法（ALS-IRLS），通过创新级自适应阈值筛选与基于 Huber 代价函数的迭代加权策略，显著提升了卡尔曼滤波器在含异常值数据下的噪声协方差估计精度及状态估计性能。

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

本文提出了 TIER 方法，通过构建隐式层次分类体系并将其融入表示学习过程，有效解决了文本丰富网络中忽视内在层次语义的问题，从而实现了更具可解释性和结构化的节点表征。

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

该论文介绍了 Covenant-72B，这是首个利用区块链协议实现完全开放、无需许可的参与，并通过高效稀疏优化器 SparseLoCo 在动态变化的全球分布式网络中成功预训练的 720 亿参数大语言模型，证明了在大规模去中心化场景下训练出具有竞争力的基础模型是可行的。

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

该论文研究表明，在连续潜在空间中进行推理（Continuous Chain-of-Thought）相比传统的显式思维链，在低资源语言的零样本场景下具有更强的鲁棒性和语言不变性，同时能将推理过程压缩 29 至 50 倍，为跨语言推理提供了可扩展的高效解决方案。

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

该论文提出了 ALOOD 方法，通过将 LiDAR 物体特征与视觉 - 语言模型（VLM）的语言表示进行对齐，将未知类别（OOD）物体的检测转化为零样本分类任务，从而有效解决了自动驾驶中 LiDAR 检测器对未知物体过度自信的安全风险。

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

AutoAdapt 是一个端到端的自动化框架，它通过利用文献知识库、多智能体辩论系统以及基于大语言模型的 AutoRefine 代理，有效解决了大语言模型在特定领域适应中依赖人工试错、超参数复杂及成本高昂等挑战，并在多项任务中显著提升了准确率。

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

本文提出了 SERQ，一种通过静态激活展平、显著性感知误差重建和离线权重置换三阶段策略，利用单一低秩补偿矩阵在无需中间量化和额外在线层的情况下，有效解决 W4A4 等低比特设置下大语言模型量化精度下降问题的方法。

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

本文针对受容量约束和区域间需求溢出效应影响的序贯服务区域设计问题，提出了一种结合实物期权分析与 Transformer 基近端策略优化算法的解决方案，以在需求不确定性下高效生成具有最优跨期权值的投资序列。

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

本文指出当前表格基础模型（如 TabPFN）的回归基准过度依赖均方误差等点估计指标，忽略了概率预测的评估，因此主张引入连续 ranked 概率分数（CRPS）等严格评分规则来评估分布回归，并强调需通过微调或提示技术来适配不同的评分规则以优化模型的归纳偏置。

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

本文通过探索替代欧氏距离的多种度量指标来量化异步联邦学习中的梯度陈旧性，并将其集成到聚合过程中，实验结果表明特定指标能在异构客户端和非独立同分布数据设置下显著提升模型的收敛速度、性能及训练稳定性。

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

本文提出了一种结合特征线性调制（FiLM）的维纳混沌展开神经网络算子，无需重整化因子即可高效求解奇异随机偏微分方程（如动态 $\Phi^4_2$ 模型），并展示了其在更具挑战性的 $\Phi^4_3$ 模型模拟中的潜力。

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

该论文通过注意力头层面的机制可解释性分析，揭示了续写触发型越狱攻击的本质是模型内在续写倾向与安全对齐防御之间的竞争，并阐明了不同架构中安全关键注意力头的功能差异，为理解及提升大语言模型安全性提供了新的理论视角。

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

本文提出了“纤维化策略优化”（FiberPO）框架，通过推导聚合策略截断目标（APC-Obj）和构建纤维束门控（FBG）代数结构，首次将信任区域理论与可组合的代数层级相结合，实现了从词元到轨迹乃至多领域层级的统一多尺度稳定性控制。

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

该论文提出了一种基于神经过程的预测系统，通过模拟患者生命体征轨迹并对照临床指南而非历史决策来判断口服抗生素转换时机，从而在 MIMIC-IV 和 UCLH 数据集上显著提升了抗生素管理决策支持的效率与准确性。

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism 提出了一种自适应个性化联邦学习框架，通过棱镜分解法将模型解耦为全局基础、共享群组及私有部分，并结合基于置信度的双流路由机制，有效解决了非独立同分布数据下的统计异质性问题，在保持泛化能力的同时显著提升了个性化性能。

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

本文提出了 FlowTouch，一种利用物体局部 3D 网格编码信息并结合流匹配生成模型的新方法，旨在实现与视角无关的视触觉预测，从而有效弥合仿真与现实的差距并提升下游抓取稳定性预测能力。

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

本文针对 ReinMax 估计器方差过高的问题，提出了结合 Rao-Blackwell 化与控制变量技术的 ReinMax-Rao 和 ReinMax-CV 估计器，在降低方差的同时提升了离散潜变量变分自编码器的训练性能，并从数值积分角度重新审视了 ReinMax 的构建原理。

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

本文提出了一种具备“冷启动”能力的自适应机载磁异常导航架构，通过扩展卡尔曼滤波将物理模型与神经网络残差学习相结合，实现了无需离线校准或专用机动即可在飞行中实时补偿飞机磁干扰并达到与离线训练模型相当的导航精度。

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

cs.LG

C2^22FG: Control Classifier-Free Guidance via Score Discrepancy Analysis