cs.LG 篇论文 | Gist.Science

Estimating condition number with Graph Neural Networks

该论文提出了一种利用图神经网络快速估计稀疏矩阵条件数的方法，通过实现线性时间复杂度的特征工程，在 1-范数和 2-范数估计任务中显著超越了传统的 Hager-Higham 和 Lanczos 方法。

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

该论文提出并理论证明了指数奖励加权监督微调（Exponential Reward-Weighted SFT）作为一种无需奖励模型、无需倾向性评分且完全离线的后训练方法，在抗奖励欺骗、可扩展性及理论保证方面均优于传统的强化学习人类反馈（RLHF）方法，能有效解决生成式推荐系统的对齐难题。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

该论文提出了一种名为 ADMM-PnP 的新框架，通过引入包含自动校正、方向校正和基于分数的去噪三阶段机制的 AC-DC 去噪器，解决了将基于分数的生成模型直接集成到 ADMM 优化算法中时面临的流形不匹配问题，并建立了在恒定步长和自适应步长下的收敛性理论保证。

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

该论文提出利用广义奇异值分解（GSVD）构建几何基础的数据集比较框架，通过推导可解释的“角度分数” $\theta(z)$ 来量化样本在两个数据集间的归属倾向，从而实现基于几何结构的单样本诊断。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

该研究提出了一种名为 Copula-ResLogit 的新型深度学习联合建模框架，通过结合残差神经网络与 Copula 模型，有效识别并消除了交通需求分析中由未观测混杂因素引起的非因果依赖，从而揭示了真实的因果效应。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

本文提出了一种名为 MultiwayPAM 的新型张量聚类方法，旨在通过分析由问题、回答者和评估者构成的 LLM-as-a-Judge 评分张量，同时估计各维度的聚类成员与中心点，从而有效解决大语言模型评估中的高计算成本与内在偏见问题并揭示评分偏差结构。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

该研究通过在 Pong 竞技强化学习环境中对比不同架构，证实了量子纠缠作为一种功能资源，能够显著提升混合智能体的表征学习能力，使其在低容量下超越经典基线并优于无纠缠的量子电路。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

该论文提出了受人类记忆启发的混合自进化结构化记忆（HyMEM），通过结合离散符号节点与连续轨迹嵌入的图结构，显著提升了开源 GUI 智能体在长程任务中的表现，使其甚至能超越部分闭源强模型。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

本文提出了 GaLoRA，这是一种参数高效的框架，通过将结构信息融入大语言模型，仅用全量微调 0.24% 的参数即可在文本属性图节点分类任务中达到与最先进模型相当的性能。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

该论文提出了一种基于大语言模型的无参数微调的上下文学习框架，通过构建与估计市场状态相匹配的演示样本，使模型能够根据历史波动模式自适应地预测非平稳市场条件下的金融波动率，并在高波动时期显著优于传统方法。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

该论文通过设计一种将学习率形状与基础学习率解耦的搜索程序，在多种任务上探索了近最优的学习率调度形状，发现预热和衰减是稳健特征，而常用调度族并非最优，且权重衰减会显著影响最优调度形状。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

该论文提出了一种利用随机束搜索对蛋白质掩码语言模型进行高效采样的灵活方法，并通过体外抗体工程实验证明，采样策略的选择对优化结果的影响至少与模型本身相当。

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

该论文提出了一种数据驱动的积分核框架，通过将非局部信息聚合与局部非线性预测解耦，在显著减少参数量的同时实现了可解释的非局部算子学习，并在南亚季风降水预测中验证了其有效性。

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面，它通过融合麦克风与振动传感器的互补信号，在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

本文针对联邦主动学习在极端非独立同分布和全局类别不平衡场景下的性能退化问题，提出了一种名为 FairFAL 的自适应框架，通过轻量级预测差异自适应选择查询模型、利用全局特征进行原型引导的伪标签生成以及两阶段不确定性 - 多样性平衡采样策略，显著提升了长尾和非独立同分布设置下的最终性能。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

本文针对非平稳线性 Bandit 中的固定预算最佳臂识别问题，通过建立适用于任意臂集的依赖臂集复杂度的下界，并提出了匹配该下界的 Adjacent-BAI 算法，从而揭示了该设定下比传统 G-最优设计更精细的复杂度特征。

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本文提出了名为 HEAL 的无强化学习框架，通过结合引导熵辅助修复、困惑度 - 不确定性比率估计及渐进式答案引导课程演化三大核心模块，有效突破了传统知识蒸馏中教师模型能力上限的制约，显著提升了小型模型从大型推理模型中学习复杂推理能力的水准。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

该论文提出了因果概念图（CCG）框架，通过结合任务条件稀疏自编码器与可微结构学习，在语言模型潜在空间中构建概念间的因果依赖关系，从而显著提升了多步推理任务中干预操作的有效性与可解释性。

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

该论文通过实验发现混合专家（MoE）模型中专家层与注意力层的计算分配比例遵循幂律关系，并据此提出了扩展的 Chinchilla 缩放定律，为在固定计算预算下优化 MoE 模型设计提供了明确的理论公式与实践指南。

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

该论文提出了一种基于损失方差感知的自适应加权策略，通过动态调整不同噪声水平下的训练权重，有效解决了扩散模型训练中的不平衡问题，从而在 CIFAR 数据集上实现了更优的生成性能与更稳定的训练过程。

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG