cs.LG 篇论文 | Gist.Science

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

该研究提出了一种名为 Copula-ResLogit 的新型深度学习联合建模框架，通过结合残差神经网络与 Copula 模型，有效识别并消除了交通需求分析中由未观测混杂因素引起的非因果依赖，从而揭示了真实的因果效应。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

本文提出了一种名为 MultiwayPAM 的新型张量聚类方法，旨在通过分析由问题、回答者和评估者构成的 LLM-as-a-Judge 评分张量，同时估计各维度的聚类成员与中心点，从而有效解决大语言模型评估中的高计算成本与内在偏见问题并揭示评分偏差结构。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

该研究通过在 Pong 竞技强化学习环境中对比不同架构，证实了量子纠缠作为一种功能资源，能够显著提升混合智能体的表征学习能力，使其在低容量下超越经典基线并优于无纠缠的量子电路。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

该论文提出了受人类记忆启发的混合自进化结构化记忆（HyMEM），通过结合离散符号节点与连续轨迹嵌入的图结构，显著提升了开源 GUI 智能体在长程任务中的表现，使其甚至能超越部分闭源强模型。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

本文提出了 GaLoRA，这是一种参数高效的框架，通过将结构信息融入大语言模型，仅用全量微调 0.24% 的参数即可在文本属性图节点分类任务中达到与最先进模型相当的性能。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

该论文提出了一种基于大语言模型的无参数微调的上下文学习框架，通过构建与估计市场状态相匹配的演示样本，使模型能够根据历史波动模式自适应地预测非平稳市场条件下的金融波动率，并在高波动时期显著优于传统方法。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

该论文通过设计一种将学习率形状与基础学习率解耦的搜索程序，在多种任务上探索了近最优的学习率调度形状，发现预热和衰减是稳健特征，而常用调度族并非最优，且权重衰减会显著影响最优调度形状。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

该论文提出了一种利用随机束搜索对蛋白质掩码语言模型进行高效采样的灵活方法，并通过体外抗体工程实验证明，采样策略的选择对优化结果的影响至少与模型本身相当。

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

该论文提出了一种数据驱动的积分核框架，通过将非局部信息聚合与局部非线性预测解耦，在显著减少参数量的同时实现了可解释的非局部算子学习，并在南亚季风降水预测中验证了其有效性。

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面，它通过融合麦克风与振动传感器的互补信号，在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

本文针对联邦主动学习在极端非独立同分布和全局类别不平衡场景下的性能退化问题，提出了一种名为 FairFAL 的自适应框架，通过轻量级预测差异自适应选择查询模型、利用全局特征进行原型引导的伪标签生成以及两阶段不确定性 - 多样性平衡采样策略，显著提升了长尾和非独立同分布设置下的最终性能。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

本文针对非平稳线性 Bandit 中的固定预算最佳臂识别问题，通过建立适用于任意臂集的依赖臂集复杂度的下界，并提出了匹配该下界的 Adjacent-BAI 算法，从而揭示了该设定下比传统 G-最优设计更精细的复杂度特征。

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本文提出了名为 HEAL 的无强化学习框架，通过结合引导熵辅助修复、困惑度 - 不确定性比率估计及渐进式答案引导课程演化三大核心模块，有效突破了传统知识蒸馏中教师模型能力上限的制约，显著提升了小型模型从大型推理模型中学习复杂推理能力的水准。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

该论文提出了因果概念图（CCG）框架，通过结合任务条件稀疏自编码器与可微结构学习，在语言模型潜在空间中构建概念间的因果依赖关系，从而显著提升了多步推理任务中干预操作的有效性与可解释性。

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

该论文通过实验发现混合专家（MoE）模型中专家层与注意力层的计算分配比例遵循幂律关系，并据此提出了扩展的 Chinchilla 缩放定律，为在固定计算预算下优化 MoE 模型设计提供了明确的理论公式与实践指南。

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

该论文提出了一种基于损失方差感知的自适应加权策略，通过动态调整不同噪声水平下的训练权重，有效解决了扩散模型训练中的不平衡问题，从而在 CIFAR 数据集上实现了更优的生成性能与更稳定的训练过程。

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

Graph-GRPO: Training Graph Flow Models with Reinforcement Learning

本文提出了 Graph-GRPO，一种针对图流模型（GFM）的在线强化学习框架，其通过推导转移概率的解析表达式以支持完全可微的 RL 训练，并引入局部扰动重生成策略以实现自我改进，从而在分子优化等任务中显著提升了生成质量并取得了最先进性能。

Baoheng Zhu, Deyu Bo, Delvin Ce Zhang, Xiao Wang2026-03-12🤖 cs.LG

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

该论文通过理论分析与实验验证，揭示了标签噪声 SGD 在两层过参数化线性网络中通过驱动模型从“懒惰”区域向“丰富”区域转变并增强权重与真实插值器的对齐，从而解释了其提升泛化能力的内在机制，并将该发现推广至锐度感知最小化（SAM）等更广泛的优化算法。

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

该论文针对服务系统配置优化中 LLM 自动评分存在偏差而人工审核成本高昂的问题，提出了一种名为 PP-LUCB 的序贯决策算法，通过结合代理分数与逆倾向加权残差估计，在显著降低人工审计成本的同时，以高置信度准确识别出最优服务配置。

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

本文提出了首个专门针对时空时间序列预测的数据集蒸馏方法 STemDist，通过平衡压缩时空维度并结合粗粒度聚类与细粒度子集蒸馏技术，在显著降低训练时间和内存消耗的同时，实现了比现有方法更低的预测误差。

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG