cs.LG 篇论文 | Gist.Science

Global universality via discrete-time signatures

该论文建立了基于分段线性路径离散时间签名的全局通用逼近定理，证明了在满足特定可积性条件下，其线性泛函在 $L^p$ 及加权范数下具有稠密性，并据此推导出了布朗运动驱动的路径依赖泛函、随机常微分方程及随机微分方程的 $L^p$ 逼近结果。

Mihriban Ceylan, David J. Prömel2026-03-11🤖 cs.LG

What is Missing? Explaining Neurons Activated by Absent Concepts

该论文指出可解释人工智能（XAI）领域长期忽视了神经元对“缺失概念”的编码现象，并提出扩展归因和特征可视化方法以有效揭示此类机制，从而提升模型解释性与去偏效果。

Robin Hesse, Simone Schaub-Meyer, Janina Hesse, Bernt Schiele, Stefan Roth2026-03-11🤖 cs.LG

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

本文提出了一种结合长短期记忆网络（LSTM）与量子电路 Born 机器（QCBM）的混合量子 - 经典框架，通过利用 QCBM 作为高质量先验分布来增强 LSTM 的特征提取能力，从而在上证综指和沪深 300 指数的高频数据上显著提升了金融波动率预测的精度。

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

该论文提出了一种名为 ACP-SL 的自适应通道剪枝方案，通过设计标签感知通道重要性评分模块来识别并剪除不重要的通道，从而压缩分裂学习中的中间特征传输数据，在降低通信开销的同时提升了测试准确率并减少了训练轮次。

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

Information Theoretic Bayesian Optimization over the Probability Simplex

该论文提出了一种基于信息几何的 $\alpha$ -GaBO 算法族，通过构建反映概率单纯形黎曼几何的 Matérn 核函数及几何优化器，实现了在该非欧几里得约束域上对昂贵黑盒目标函数的数据高效优化，并在多项实际应用中展现出优于传统欧氏约束方法的性能。

Federico Pavesi, Antonio Candelieri, Noémie Jaquier2026-03-11🤖 cs.LG

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

该论文提出了一种名为“上下文强化学习验证（In-Context RLVR）”的新方法，通过利用模型自身的上下文学习能力生成“证据增益”信号来隐式地根据推理质量对奖励进行重加权，从而在无需外部评估器的情况下解决传统 RLVR 可能强化低质量推理路径的问题，显著提升了数学基准测试中的准确率与推理质量。

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

该论文提出了一种受多重网格启发、可无缝集成到现有模型中的轻量级“平滑伪投影器”，通过抑制与标签无关的输入方向来修正 Transformer 模型的隐藏表示，从而在文本分类等任务中显著提升了训练动态和鲁棒性。

Vitaly Bulgakov2026-03-11🤖 cs.AI

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本文提出了一种基于高斯过程的统一分层多任务多保真度（H-MT-MF）框架，通过联合建模任务间相似性与保真度依赖性，有效解决了制造系统代理建模中数据需求大及多源异构数据利用不足的问题，显著提升了预测精度。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui Shao2026-03-11🤖 cs.LG

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

该论文提出了一种名为 HR-GAT 的层次化分辨率图注意力网络模型，利用地理空间数据有效解决空间自相关难题，在五个加拿大主要城市的测试中将其频谱需求预测精度较八种基准模型提升了 21%。

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

GAST: Gradient-aligned Sparse Tuning of Large Language Models with Data-layer Selection

本文提出了梯度对齐稀疏微调（GAST）方法，通过统一优化策略在数据层和模型层两个维度上自适应地选择最具影响力的数据点与关键层，有效解决了现有参数高效微调方法忽视数据对不同层贡献差异的问题，并在实验中展现出优于基线的性能。

Kai Yao, Zhenghan Song, Kaixin Wu, Mingjie Zhong, Danzhao Cheng, Zhaorui Tan, Yixin Ji, Penglei Gao2026-03-11🤖 cs.LG

CarbonBench: A Global Benchmark for Upscaling of Carbon Fluxes Using Zero-Shot Learning

本文介绍了 CarbonBench，这是首个旨在通过零样本空间迁移学习评估全球碳通量上模型性能的标准基准，它利用来自全球 567 个通量塔站的 130 多万条观测数据，提供了分层评估协议、统一特征集及多种基线模型，以推动机器学习与地球系统科学的融合及下一代气候建模的发展。

Aleksei Rozanov, Arvind Renganathan, Yimeng Zhang, Vipin Kumar2026-03-11🤖 cs.LG

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

该论文提出了一种名为 MSSR 的记忆感知自适应回放框架，通过估计样本级记忆强度并动态调整复习间隔，在持续微调大语言模型时有效缓解了灾难性遗忘问题，同时保持了快速适应能力，并在多项基准测试中显著优于现有方法。

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

本文提出了名为 OptEMA 的自适应指数移动平均优化器及其两个变体，通过引入闭环、无需 Lipschitz 常数的机制，在标准随机梯度下降假设下实现了噪声自适应的收敛率，并在零噪声情形下无需手动调整超参数即可达到近乎最优的确定性收敛速度。

Ganzhao Yuan2026-03-11🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

该论文从谱分析和变分视角揭示了生成漂移与得分匹配之间的本质联系，通过线性化麦基恩 - 弗拉索夫动力学和形式化最优传输梯度流，不仅解释了高斯核的频域瓶颈并提出了指数带宽退火策略，还从理论层面证明了停止梯度算子在训练稳定性中的必要性。

Erkan Turan, Maks Ovsjanikov2026-03-11🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

本文提出了名为 SignalMC-MED 的多模态基准，利用包含 22,256 次就诊的同步单导联 ECG 和 PPG 数据评估生物信号基础模型，发现领域专用模型优于通用模型、多模态融合优于单模态输入，并揭示了长信号段、小模型及手工特征在特定场景下的优势。

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton2026-03-11🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

该论文提出利用过拟合 - 欠拟合指示器（OUI）作为早期信号，通过分析 PPO 中隐藏神经元的激活模式变化来区分学习率设置，从而在训练初期高效筛选出最优策略并避免全量训练。

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

该论文提出了“神经调试器”这一新概念，通过微调大语言模型或从头预训练小模型，使其能够像传统调试器一样支持断点设置和步进操作，从而实现对 Python 程序正向执行预测与逆向状态推断的可靠建模，为构建具备模拟调试能力的智能体编程系统奠定了基础。

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

该论文通过引入具有层可组合性的均值归一化算子范数，将 AdamW 和 Muon 等优化器统一为矩阵算子范数下的最速下降法，从而提出了能实现宽度无关平滑度保证及跨宽度超参数迁移的 MOGA 优化器，并在 GPT-2 和 LLaMA 的大规模预训练中展现出比 Muon 更优的效率与稳定性。

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

该论文提出了 C2FMAE，一种通过语义、实例和像素三级粒度协同学习及渐进式掩码策略来解决自监督视觉预训练中全局语义与局部细节矛盾的新型分层掩码自编码器，并在大规模多粒度数据集上验证了其在多种视觉任务中的卓越性能。

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

该论文通过新颖的道德权衡数据集发现，与人类不同，推理过程能显著提升大语言模型的诚实度，其根本原因在于欺骗性回答在表征空间中处于亚稳态，而推理生成的思维链通过遍历该空间将模型推向更稳定的诚实默认状态。

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI