cs.LG 篇论文 | Gist.Science

Evolution of Photonic Quantum Machine Learning under Noise

这篇综述系统分析了光子量子机器学习系统中的噪声来源及其对性能的影响，探讨了相关算法与噪声表征技术，并总结了噪声缓解策略与未来研究方向。

A. M. A. S. D. Alagiyawanna, Asoka Karunananda2026-03-11⚛️ quant-ph

Well Log-Guided Synthesis of Subsurface Images from Sparse Petrography Data Using cGANs

该论文提出了一种基于条件生成对抗网络（cGAN）的框架，利用测井数据中的孔隙度信息，从稀疏的岩石薄片数据中合成连续的碳酸盐岩孔隙尺度图像，从而有效填补了储层表征中的深度间隙并支持碳捕获与地下储氢等应用。

Ali Sadeghkhani, A. Assadi, B. Bennett, A. Rabbani2026-03-11🤖 cs.LG

FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting

该论文提出了 FreqCycle 及其分层扩展 MFreqCycle 框架，通过结合时域滤波增强循环预测与频域分段模式学习，有效挖掘了被忽视的中高频特征并解耦多周期耦合，从而在多个基准测试中实现了兼具高精度与高效率的时间序列预测。

Boya Zhang, Shuaijie Yin, Huiwen Zhu, Xing He2026-03-11🤖 cs.LG

No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

该论文通过引入可控偏差的评估框架，实证分析了标签偏差和选择偏差对分类模型评估、性能及去偏方法有效性的差异化影响，揭示了在无偏测试集下公平性与准确性之间不存在权衡，并强调了针对特定偏差类型优化评估与缓解策略的重要性。

Magali Legast, Toon Calders, François Fouss2026-03-11🤖 cs.LG

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

该论文提出了一个用于图神经网络时间序列异常检测的开源框架，通过系统性评估揭示了 GNN 在提升检测性能与可解释性方面的优势，并批判性地反思了当前领域在指标设计与阈值策略上的局限性。

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

该论文提出了 EsoLang-Bench 基准，通过利用缺乏预训练数据且难以被“刷分”的极简主义编程语言，揭示了大型语言模型在标准代码生成任务中表现优异实则依赖记忆，而在需要真正推理能力的任务中表现极差，从而证明现有模型缺乏真正的泛化推理能力。

Aman Sharma, Paras Chopra2026-03-11🤖 cs.AI

On Catastrophic Forgetting in Low-Rank Decomposition-Based Parameter-Efficient Fine-Tuning

该论文通过实证研究揭示了低秩分解参数高效微调中的灾难性遗忘现象主要受更新子空间的几何结构与参数化方式影响，并指出张量分解和结构对齐参数化方法能有效缓解遗忘，为连续学习场景下的策略选择提供了实践指导。

Muhammad Ahmad, Jingjing Zheng, Yankai Cao2026-03-11🤖 cs.LG

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

该论文提出了 ActiveUltraFeedback，一种利用主动学习动态筛选高信息量样本以生成偏好数据的模块化流程，通过引入 DRTS 和 DeltaUCB 等新颖方法，仅用六分之一的标注数据即可实现与静态基线相当甚至更优的大语言模型对齐效果。

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas Krause2026-03-11🤖 cs.AI

Physics-informed neural operator for predictive parametric phase-field modelling

本文提出了一种名为 PF-PINO 的物理信息神经算子框架，通过将相场控制方程的残差嵌入损失函数来强制物理约束，从而在精度、泛化能力和长期稳定性上显著优于传统傅里叶神经算子，为复杂界面演化问题的高效预测提供了鲁棒的计算工具。

Nanxi Chen, Airong Chen, Rujin Ma2026-03-11🔬 cond-mat.mtrl-sci

Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning

本文提出了名为 Mousse 的新型优化器，它通过结合 Shampoo 的曲率感知预条件技术与 Muon 的谱优化方法，在黎曼流形上实现了各向异性的信任区域约束，从而在几乎不增加计算开销的情况下显著提升了语言模型的训练效率。

Yechen Zhang, Shuhao Xing, Junhao Huang, Kai Lv, Yunhua Zhou, Xipeng Qiu, Qipeng Guo, Kai Chen2026-03-11🤖 cs.AI

A Multi-Prototype-Guided Federated Knowledge Distillation Approach in AI-RAN Enabled Multi-Access Edge Computing System

本文针对 AI-RAN 赋能的多接入边缘计算系统中联邦学习面临的非独立同分布数据挑战，提出了一种通过引入条件层次凝聚聚类与原型对齐机制的多原型引导联邦知识蒸馏（MP-FedKD）方法，有效克服了单原型策略的信息丢失问题并显著提升了模型精度。

Luyao Zou, Hayoung Oh, Chu Myaet Thwal, Apurba Adhikary, Seohyeon Hong, Zhu Han2026-03-11🤖 cs.LG

Upper Generalization Bounds for Neural Oscillators

本文针对基于二阶常微分方程的神经振荡器，利用 Rademacher 复杂度框架推导了其泛化误差上界，证明了误差随网络规模和时长呈多项式增长且可通过正则化约束提升泛化能力，并通过 Bouc-Wen 非线性系统的数值实验验证了理论结果。

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael Beer2026-03-11🤖 cs.LG

Global universality via discrete-time signatures

该论文建立了基于分段线性路径离散时间签名的全局通用逼近定理，证明了在满足特定可积性条件下，其线性泛函在 $L^p$ 及加权范数下具有稠密性，并据此推导出了布朗运动驱动的路径依赖泛函、随机常微分方程及随机微分方程的 $L^p$ 逼近结果。

Mihriban Ceylan, David J. Prömel2026-03-11🤖 cs.LG

What is Missing? Explaining Neurons Activated by Absent Concepts

该论文指出可解释人工智能（XAI）领域长期忽视了神经元对“缺失概念”的编码现象，并提出扩展归因和特征可视化方法以有效揭示此类机制，从而提升模型解释性与去偏效果。

Robin Hesse, Simone Schaub-Meyer, Janina Hesse, Bernt Schiele, Stefan Roth2026-03-11🤖 cs.LG

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

本文提出了一种结合长短期记忆网络（LSTM）与量子电路 Born 机器（QCBM）的混合量子 - 经典框架，通过利用 QCBM 作为高质量先验分布来增强 LSTM 的特征提取能力，从而在上证综指和沪深 300 指数的高频数据上显著提升了金融波动率预测的精度。

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

该论文提出了一种名为 ACP-SL 的自适应通道剪枝方案，通过设计标签感知通道重要性评分模块来识别并剪除不重要的通道，从而压缩分裂学习中的中间特征传输数据，在降低通信开销的同时提升了测试准确率并减少了训练轮次。

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

Information Theoretic Bayesian Optimization over the Probability Simplex

该论文提出了一种基于信息几何的 $\alpha$ -GaBO 算法族，通过构建反映概率单纯形黎曼几何的 Matérn 核函数及几何优化器，实现了在该非欧几里得约束域上对昂贵黑盒目标函数的数据高效优化，并在多项实际应用中展现出优于传统欧氏约束方法的性能。

Federico Pavesi, Antonio Candelieri, Noémie Jaquier2026-03-11🤖 cs.LG

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

该论文提出了一种名为“上下文强化学习验证（In-Context RLVR）”的新方法，通过利用模型自身的上下文学习能力生成“证据增益”信号来隐式地根据推理质量对奖励进行重加权，从而在无需外部评估器的情况下解决传统 RLVR 可能强化低质量推理路径的问题，显著提升了数学基准测试中的准确率与推理质量。

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

该论文提出了一种受多重网格启发、可无缝集成到现有模型中的轻量级“平滑伪投影器”，通过抑制与标签无关的输入方向来修正 Transformer 模型的隐藏表示，从而在文本分类等任务中显著提升了训练动态和鲁棒性。

Vitaly Bulgakov2026-03-11🤖 cs.AI

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本文提出了一种基于高斯过程的统一分层多任务多保真度（H-MT-MF）框架，通过联合建模任务间相似性与保真度依赖性，有效解决了制造系统代理建模中数据需求大及多源异构数据利用不足的问题，显著提升了预测精度。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui Shao2026-03-11🤖 cs.LG