cs.LG 篇论文 | Gist.Science

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

本文提出了一种用于求解具有随机目标函数及确定性非线性约束优化问题的信任域内点随机序列二次规划（TR-IP-SSQP）方法，该方法通过构建满足自适应精度条件的随机 Oracle 并结合内点法处理不等式约束，在标准假设下证明了其几乎处处收敛到一阶驻点，并在 CUTEst 测试集和逻辑回归问题上验证了其实际性能。

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

该论文提出了 I2X 框架，通过量化训练过程中基于原型（prototypes）的进展，将非结构化的可解释性转化为结构化解释，从而不仅忠实揭示了图像分类模型的决策机制，还能通过识别不确定原型并针对性微调样本以提升模型预测精度。

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

该论文针对类别增量学习中任务步长不平衡的挑战，提出了名为 One-A 的统一框架，通过非对称子空间对齐、信息自适应加权及方向门控机制，将多任务更新高效融合至单一适配器中，在保持恒定推理成本的同时显著提升了模型在动态任务规模下的性能与稳定性。

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

该研究证明了一种用于求解偏微分方程的原生脉冲神经形态算法具有内在的容错性，能够容忍高达 32% 的神经元损毁和 90% 的脉冲丢失而不显著降低计算精度，且这种鲁棒性可通过结构超参数进行调节。

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

本文提出了名为 SiMPO 的简单统一框架，通过引入带符号测度匹配和 $f$ -散度正则化，将扩散强化学习中的重加权方案推广至任意单调函数，从而有效利用负样本反馈并避免策略过度贪婪，显著提升了算法性能。

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

本文证明了当贝叶斯层次模型中给定超参数的先验为最大熵分布时，通过对超参数积分得到的参数边缘先验同样具有最大熵性质，只是其约束条件变为对未知量某函数的边缘分布的约束，从而揭示了层次模型所隐含的假设信息。

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

该论文针对 TabPFN 因特征生成顺序与因果结构冲突而产生虚假相关的问题，提出了结合有向无环图（DAG）和部分有向无环图（CPDAG）的因果感知条件生成策略，显著提升了合成数据的结构保真度、分布对齐性及因果效应（ATE）的保留能力。

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

该研究通过机械可解释性方法，从单细胞基础模型 scGPT 中提取并验证了一个紧凑的造血算法，该算法在无需目标数据集重训练的情况下，在发育分支结构解析和细胞亚型分类等任务上显著优于现有主流方法，并揭示了其内部由特定基因程序构成的核心机制。

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

本文提出了分布收缩强化学习（DICE-RL）框架，通过结合选择性行为正则化与价值引导动作选择的稳定残差离线强化学习，将预训练的生成式机器人策略高效微调为能够直接从高维像素输入掌握复杂长程操作技能的高性能专家策略。

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

该论文提出了一种利用图神经网络快速估计稀疏矩阵条件数的方法，通过实现线性时间复杂度的特征工程，在 1-范数和 2-范数估计任务中显著超越了传统的 Hager-Higham 和 Lanczos 方法。

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

该论文提出并理论证明了指数奖励加权监督微调（Exponential Reward-Weighted SFT）作为一种无需奖励模型、无需倾向性评分且完全离线的后训练方法，在抗奖励欺骗、可扩展性及理论保证方面均优于传统的强化学习人类反馈（RLHF）方法，能有效解决生成式推荐系统的对齐难题。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

该论文提出了一种名为 ADMM-PnP 的新框架，通过引入包含自动校正、方向校正和基于分数的去噪三阶段机制的 AC-DC 去噪器，解决了将基于分数的生成模型直接集成到 ADMM 优化算法中时面临的流形不匹配问题，并建立了在恒定步长和自适应步长下的收敛性理论保证。

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

该论文提出利用广义奇异值分解（GSVD）构建几何基础的数据集比较框架，通过推导可解释的“角度分数” $\theta(z)$ 来量化样本在两个数据集间的归属倾向，从而实现基于几何结构的单样本诊断。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

该研究提出了一种名为 Copula-ResLogit 的新型深度学习联合建模框架，通过结合残差神经网络与 Copula 模型，有效识别并消除了交通需求分析中由未观测混杂因素引起的非因果依赖，从而揭示了真实的因果效应。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

本文提出了一种名为 MultiwayPAM 的新型张量聚类方法，旨在通过分析由问题、回答者和评估者构成的 LLM-as-a-Judge 评分张量，同时估计各维度的聚类成员与中心点，从而有效解决大语言模型评估中的高计算成本与内在偏见问题并揭示评分偏差结构。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

该研究通过在 Pong 竞技强化学习环境中对比不同架构，证实了量子纠缠作为一种功能资源，能够显著提升混合智能体的表征学习能力，使其在低容量下超越经典基线并优于无纠缠的量子电路。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

该论文提出了受人类记忆启发的混合自进化结构化记忆（HyMEM），通过结合离散符号节点与连续轨迹嵌入的图结构，显著提升了开源 GUI 智能体在长程任务中的表现，使其甚至能超越部分闭源强模型。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

本文提出了 GaLoRA，这是一种参数高效的框架，通过将结构信息融入大语言模型，仅用全量微调 0.24% 的参数即可在文本属性图节点分类任务中达到与最先进模型相当的性能。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

该论文提出了一种基于大语言模型的无参数微调的上下文学习框架，通过构建与估计市场状态相匹配的演示样本，使模型能够根据历史波动模式自适应地预测非平稳市场条件下的金融波动率，并在高波动时期显著优于传统方法。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

该论文通过设计一种将学习率形状与基础学习率解耦的搜索程序，在多种任务上探索了近最优的学习率调度形状，发现预热和衰减是稳健特征，而常用调度族并非最优，且权重衰减会显著影响最优调度形状。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG