cs.LG 篇论文 | Gist.Science

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

该论文提出了 ALOOD 方法，通过将 LiDAR 物体特征与视觉 - 语言模型（VLM）的语言表示进行对齐，将未知类别（OOD）物体的检测转化为零样本分类任务，从而有效解决了自动驾驶中 LiDAR 检测器对未知物体过度自信的安全风险。

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

AutoAdapt 是一个端到端的自动化框架，它通过利用文献知识库、多智能体辩论系统以及基于大语言模型的 AutoRefine 代理，有效解决了大语言模型在特定领域适应中依赖人工试错、超参数复杂及成本高昂等挑战，并在多项任务中显著提升了准确率。

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

本文提出了 SERQ，一种通过静态激活展平、显著性感知误差重建和离线权重置换三阶段策略，利用单一低秩补偿矩阵在无需中间量化和额外在线层的情况下，有效解决 W4A4 等低比特设置下大语言模型量化精度下降问题的方法。

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

本文针对受容量约束和区域间需求溢出效应影响的序贯服务区域设计问题，提出了一种结合实物期权分析与 Transformer 基近端策略优化算法的解决方案，以在需求不确定性下高效生成具有最优跨期权值的投资序列。

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

本文指出当前表格基础模型（如 TabPFN）的回归基准过度依赖均方误差等点估计指标，忽略了概率预测的评估，因此主张引入连续 ranked 概率分数（CRPS）等严格评分规则来评估分布回归，并强调需通过微调或提示技术来适配不同的评分规则以优化模型的归纳偏置。

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

本文通过探索替代欧氏距离的多种度量指标来量化异步联邦学习中的梯度陈旧性，并将其集成到聚合过程中，实验结果表明特定指标能在异构客户端和非独立同分布数据设置下显著提升模型的收敛速度、性能及训练稳定性。

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

本文提出了一种结合特征线性调制（FiLM）的维纳混沌展开神经网络算子，无需重整化因子即可高效求解奇异随机偏微分方程（如动态 $\Phi^4_2$ 模型），并展示了其在更具挑战性的 $\Phi^4_3$ 模型模拟中的潜力。

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

该论文通过注意力头层面的机制可解释性分析，揭示了续写触发型越狱攻击的本质是模型内在续写倾向与安全对齐防御之间的竞争，并阐明了不同架构中安全关键注意力头的功能差异，为理解及提升大语言模型安全性提供了新的理论视角。

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

Fibration Policy Optimization

本文提出了“纤维化策略优化”（FiberPO）框架，通过推导聚合策略截断目标（APC-Obj）和构建纤维束门控（FBG）代数结构，首次将信任区域理论与可组合的代数层级相结合，实现了从词元到轨迹乃至多领域层级的统一多尺度稳定性控制。

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

该论文提出了一种基于神经过程的预测系统，通过模拟患者生命体征轨迹并对照临床指南而非历史决策来判断口服抗生素转换时机，从而在 MIMIC-IV 和 UCLH 数据集上显著提升了抗生素管理决策支持的效率与准确性。

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

FedPrism 提出了一种自适应个性化联邦学习框架，通过棱镜分解法将模型解耦为全局基础、共享群组及私有部分，并结合基于置信度的双流路由机制，有效解决了非独立同分布数据下的统计异质性问题，在保持泛化能力的同时显著提升了个性化性能。

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

本文提出了 FlowTouch，一种利用物体局部 3D 网格编码信息并结合流匹配生成模型的新方法，旨在实现与视角无关的视触觉预测，从而有效弥合仿真与现实的差距并提升下游抓取稳定性预测能力。

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

本文针对 ReinMax 估计器方差过高的问题，提出了结合 Rao-Blackwell 化与控制变量技术的 ReinMax-Rao 和 ReinMax-CV 估计器，在降低方差的同时提升了离散潜变量变分自编码器的训练性能，并从数值积分角度重新审视了 ReinMax 的构建原理。

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

本文提出了一种具备“冷启动”能力的自适应机载磁异常导航架构，通过扩展卡尔曼滤波将物理模型与神经网络残差学习相结合，实现了无需离线校准或专用机动即可在飞行中实时补偿飞机磁干扰并达到与离线训练模型相当的导航精度。

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

该论文针对金融语言模型中偏见检测计算成本高昂的问题，通过大规模实证研究揭示了不同模型间偏见揭示输入的一致性模式，并提出了一种利用跨模型引导显著降低检测成本的新方法。

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

本文提出了 SCL-GNN 框架，通过利用希尔伯特 - 施密特独立性准则（HSIC）量化并抑制节点特征与标签间的虚假相关性，结合双层优化策略，显著提升了图神经网络在分布内及分布外场景下的泛化能力。

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

本文提出了一种名为 TA-RNN-Medical-Hybrid 的时间感知与可解释混合深度学习框架，通过整合显式连续时间编码、SNOMED 疾病表示及分层注意力机制，在 MIMIC-III 数据集上实现了对 ICU 患者死亡风险的高精度预测与符合医学知识的有效解释。

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

本文提出了 PolyFormer，一种将物理与几何知识融入优化问题重构的机器学习方法，通过将其转化为高效的多面体形式，在保持解质量的同时实现了高达 6400 倍的计算加速和 99.87% 的内存缩减，从而显著提升了复杂物理约束下大规模优化问题的可扩展性。

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

该论文通过递归应用 Borell-Tsirelson-Ibragimov-Sudakov 不等式证明高斯过程后验采样强化学习（GP-PSRL）算法在连续控制中的访问状态有界，并利用链式方法推导出了针对无界状态空间的紧贝叶斯后悔界 $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ ，从而解决了现有理论在最大信息增益依赖性和状态空间无界性方面的局限。

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

该论文揭示了在深度线性对角网络中，Sharpness-Aware Minimization (SAM) 会因深度增加而产生显著的隐式偏差，特别是 $\ell_2$ -SAM 会表现出“顺序特征放大”现象，即模型在训练初期依赖次要特征并逐渐转向主要特征，从而证明了仅依靠无限时间隐式偏差分析不足以全面理解 SAM 的有限时间动态。

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG