cs.LG 篇论文 | Gist.Science

Automated Reinforcement Learning: An Overview

本文综述了自动化强化学习（AutoRL）的相关文献，涵盖了从 MDP 建模、算法选择到超参数优化的自动化工具及基于大语言模型的最新技术，并探讨了该领域的未来挑战与研究方向。

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

该论文提出了一种将数据不确定性作为额外输入的可解释子序列模型，在保持与最先进方法相当分类性能的同时，解决了现有可解释时间序列方法在处理天文不确定时间序列时性能不足的问题，并能为天体物理理论建模提供新的见解。

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

Empirical Asset Pricing via Ensemble Gaussian Process Regression

该论文提出了一种基于高斯过程回归的集成学习方法，用于预测股票条件预期收益，实证表明该方法在统计和经济指标上均优于现有机器学习模型，并能通过利用预测不确定性构建均值 - 方差最优投资组合，显著跑赢标普 500 指数。

Damir Filipovic, Puneet Pasricha2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

该论文研究了通过直接预测多步成本而非观测或动作来学习潜在状态表示的方法，并针对有限时变线性二次高斯（LQG）控制问题，首次建立了该成本驱动方法能够找到近优状态表示函数和近优控制器的有限样本理论保证。

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

On the Impact of Sampling on Deep Sequential State Estimation

本文提出将重要性采样应用于深度卡尔曼滤波框架以构建 IW-DKF 模型，通过引入更紧的蒙特卡洛目标函数，显著提升了非线性物理模型在生成性能、状态推断及参数估计方面的表现。

Helena Calatrava, Ricardo Augusto Borsoi, Tales Imbiriba + 1 more2026-03-10🤖 cs.LG

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

该论文提出了名为 MU-Mis 的机器学习遗忘方法，通过理论揭示样本贡献体现为模型对其敏感度的增加，并直接抑制这种敏感度，从而在无需访问剩余数据的情况下实现了与依赖剩余数据方法相当的高效遗忘效果，同时保持了模型在剩余数据上的效用。

Xinwen Cheng, Zhehao Huang, Wenxin Zhou, Zhengbao He, Ruikai Yang, Yingwen Wu, Xiaolin Huang2026-03-10🤖 cs.LG

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

本文从机器学习视角出发，对计算机化自适应测试（CAT）进行了全面综述，深入探讨了测量模型、选题算法、题库构建及测试控制等核心环节如何利用机器学习技术进行优化，旨在推动心理测量学与机器学习的跨学科融合，以构建更稳健、公平且高效的自适应测试系统。

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

该论文提出了一种将环境记忆编码为耗散子（dissipatons）的神经量子态框架（NQS-DQME），通过构建耗散子嵌入量子主方程，在保持与精确层级运动方程相当精度的同时，显著提升了模拟非马尔可夫开放量子系统多体关联与记忆效应的可扩展性与可解释性。

Long Cao, Liwei Ge, Daochi Zhang, Xiang Li, Yao Wang, Rui-Xue Xu, YiJing Yan, Xiao Zheng2026-03-10⚛️ quant-ph

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

本文提出了 LoRA-Ensemble，一种基于低秩适应（LoRA）的参数高效隐式集成方法，它通过让多个集成成员共享预训练自注意力网络并仅使用独立的低秩投影矩阵，在显著降低计算和内存成本的同时，实现了超越现有隐式技术、媲美显式集成且校准更优的预测性能。

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

该论文提出了一种名为 FEX 的新框架，通过利用策略梯度方法优化概率分布来生成归因解释，从而在保持高质量和广泛适用性的同时，将推理时间和内存占用分别降低了 97% 和 70%，有效解决了现有解释方法效率低下的问题。

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

该论文揭示了扩散模型在少样本微调过程中存在的“腐蚀阶段”现象，并通过引入贝叶斯神经网络扩展学习分布，有效缓解了该问题并提升了生成图像的质量与多样性。

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

本文提出了一种名为 DKDL-Net 的轻量级滚动轴承故障诊断模型，该模型通过解耦知识蒸馏与低秩自适应微调技术，在显著降低参数量（仅 6838 个）的同时实现了 99.48% 的高精度，性能优于现有最先进模型。

Ovanes Petrosian, Li Pengyi, He Yulong + 4 more2026-03-10🤖 cs.LG

cs.LG

Automated Reinforcement Learning: An Overview

Explainable classification of astronomical uncertain time series

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

On the Impact of Sampling on Deep Sequential State Estimation

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

Fast Explanations via Policy Gradient-Optimized Explainer

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

LAMBDA: A Large Model Based Data Agent

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

The Z-Gromov-Wasserstein Distance

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

Reconsidering the energy efficiency of spiking neural networks