cs.LG 篇论文 | Gist.Science

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

该论文针对 TabPFN 因特征生成顺序与因果结构冲突而产生虚假相关的问题，提出了结合有向无环图（DAG）和部分有向无环图（CPDAG）的因果感知条件生成策略，显著提升了合成数据的结构保真度、分布对齐性及因果效应（ATE）的保留能力。

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

该研究通过机械可解释性方法，从单细胞基础模型 scGPT 中提取并验证了一个紧凑的造血算法，该算法在无需目标数据集重训练的情况下，在发育分支结构解析和细胞亚型分类等任务上显著优于现有主流方法，并揭示了其内部由特定基因程序构成的核心机制。

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

本文提出了分布收缩强化学习（DICE-RL）框架，通过结合选择性行为正则化与价值引导动作选择的稳定残差离线强化学习，将预训练的生成式机器人策略高效微调为能够直接从高维像素输入掌握复杂长程操作技能的高性能专家策略。

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

该论文提出了一种利用图神经网络快速估计稀疏矩阵条件数的方法，通过实现线性时间复杂度的特征工程，在 1-范数和 2-范数估计任务中显著超越了传统的 Hager-Higham 和 Lanczos 方法。

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

该论文提出并理论证明了指数奖励加权监督微调（Exponential Reward-Weighted SFT）作为一种无需奖励模型、无需倾向性评分且完全离线的后训练方法，在抗奖励欺骗、可扩展性及理论保证方面均优于传统的强化学习人类反馈（RLHF）方法，能有效解决生成式推荐系统的对齐难题。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

该论文提出了一种名为 ADMM-PnP 的新框架，通过引入包含自动校正、方向校正和基于分数的去噪三阶段机制的 AC-DC 去噪器，解决了将基于分数的生成模型直接集成到 ADMM 优化算法中时面临的流形不匹配问题，并建立了在恒定步长和自适应步长下的收敛性理论保证。

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

该论文提出利用广义奇异值分解（GSVD）构建几何基础的数据集比较框架，通过推导可解释的“角度分数” $\theta(z)$ 来量化样本在两个数据集间的归属倾向，从而实现基于几何结构的单样本诊断。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

该研究提出了一种名为 Copula-ResLogit 的新型深度学习联合建模框架，通过结合残差神经网络与 Copula 模型，有效识别并消除了交通需求分析中由未观测混杂因素引起的非因果依赖，从而揭示了真实的因果效应。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

本文提出了一种名为 MultiwayPAM 的新型张量聚类方法，旨在通过分析由问题、回答者和评估者构成的 LLM-as-a-Judge 评分张量，同时估计各维度的聚类成员与中心点，从而有效解决大语言模型评估中的高计算成本与内在偏见问题并揭示评分偏差结构。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

该研究通过在 Pong 竞技强化学习环境中对比不同架构，证实了量子纠缠作为一种功能资源，能够显著提升混合智能体的表征学习能力，使其在低容量下超越经典基线并优于无纠缠的量子电路。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

该论文提出了受人类记忆启发的混合自进化结构化记忆（HyMEM），通过结合离散符号节点与连续轨迹嵌入的图结构，显著提升了开源 GUI 智能体在长程任务中的表现，使其甚至能超越部分闭源强模型。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

本文提出了 GaLoRA，这是一种参数高效的框架，通过将结构信息融入大语言模型，仅用全量微调 0.24% 的参数即可在文本属性图节点分类任务中达到与最先进模型相当的性能。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

该论文提出了一种基于大语言模型的无参数微调的上下文学习框架，通过构建与估计市场状态相匹配的演示样本，使模型能够根据历史波动模式自适应地预测非平稳市场条件下的金融波动率，并在高波动时期显著优于传统方法。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

该论文通过设计一种将学习率形状与基础学习率解耦的搜索程序，在多种任务上探索了近最优的学习率调度形状，发现预热和衰减是稳健特征，而常用调度族并非最优，且权重衰减会显著影响最优调度形状。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

该论文提出了一种利用随机束搜索对蛋白质掩码语言模型进行高效采样的灵活方法，并通过体外抗体工程实验证明，采样策略的选择对优化结果的影响至少与模型本身相当。

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

该论文提出了一种数据驱动的积分核框架，通过将非局部信息聚合与局部非线性预测解耦，在显著减少参数量的同时实现了可解释的非局部算子学习，并在南亚季风降水预测中验证了其有效性。

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面，它通过融合麦克风与振动传感器的互补信号，在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

本文针对联邦主动学习在极端非独立同分布和全局类别不平衡场景下的性能退化问题，提出了一种名为 FairFAL 的自适应框架，通过轻量级预测差异自适应选择查询模型、利用全局特征进行原型引导的伪标签生成以及两阶段不确定性 - 多样性平衡采样策略，显著提升了长尾和非独立同分布设置下的最终性能。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

本文针对非平稳线性 Bandit 中的固定预算最佳臂识别问题，通过建立适用于任意臂集的依赖臂集复杂度的下界，并提出了匹配该下界的 Adjacent-BAI 算法，从而揭示了该设定下比传统 G-最优设计更精细的复杂度特征。

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本文提出了名为 HEAL 的无强化学习框架，通过结合引导熵辅助修复、困惑度 - 不确定性比率估计及渐进式答案引导课程演化三大核心模块，有效突破了传统知识蒸馏中教师模型能力上限的制约，显著提升了小型模型从大型推理模型中学习复杂推理能力的水准。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

← 上一页下一页 →