cs.LG 篇论文 | Gist.Science

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

本文提出了一种基于卷积田鼠机（CTM）的轻量级、可解释且硬件高效的 5G 网络干扰检测方案，该方案在真实 5G 测试床上验证了其性能，相比传统卷积神经网络（CNN）在保持相当检测精度的同时显著提升了训练速度并降低了内存占用，且具备在 FPGA 边缘设备上部署的潜力。

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

本文提出了名为 Mechanistic CBM (M-CBM) 的新型概念瓶颈模型框架，该框架通过稀疏自编码器从黑盒模型中提取并命名内在概念，从而在严格控制信息泄露的前提下，显著提升了概念预测的准确性、决策稀疏性及解释的简洁性，并超越了现有的概念瓶颈模型。

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

该论文提出了一种多模态临床预测的实践不变表示学习框架，通过联合优化预测性能与抑制环境依赖信息，有效解决了因医疗实践差异导致的系统性分布偏移问题，显著提升了模型在跨机构场景下的泛化能力与校准度。

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

该论文提出了一种名为 DistGP 的分布式多机器人学习方法，它利用稀疏高斯过程模型和基于高斯信念传播的分布式训练机制，在仅依赖局部数据的情况下实现了与集中式模型相当的精度，且在动态连接、稀疏通信及持续学习场景下优于现有的树结构高斯过程和分布式神经网络优化器。

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

该论文提出了 AgrI 挑战赛，通过引入多团队独立采集数据的跨团队验证（CTV）评估范式，揭示了单一数据源训练在农业视觉任务中的泛化缺陷，并证明了多源协作训练能显著缩小跨域泛化差距，同时发布了一个包含 5 万余张图像的大规模公开数据集以推动数据为中心的农业视觉研究。

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

该论文提出了一种利用嵌套 Dropout 为扩散模型、归一化流和变分自编码器引入可调复杂度先验的方法，通过在压缩感知等逆问题中动态平衡表示误差与过拟合风险，显著降低了重建误差并提供了相应的理论分析。

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

本文提出了一种名为 N-Tree Diffusion 的层次化扩散模型，通过共享早期去噪阶段并在后期分支以生成连续的火险图，在降低计算成本的同时实现了长时序野火风险的概率预测。

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

该论文填补了亚 2000 万参数“小模型”领域的研究空白，揭示了在 TinyML 规模下模型误差率虽遵循幂律但指数更陡、饱和更早，且误差分布、类别难度偏好及校准度均随规模发生显著质变，从而证明直接套用大模型规律会误导边缘 AI 部署，必须在目标模型规模下进行验证。

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

本文提出了一种基于分层多智能体强化学习的无信道状态信息（CSI）毫米波波束聚焦框架，利用用户定位数据替代传统信道估计，通过集中训练分散执行的多智能体近端策略优化算法有效解决大规模组合动作空间问题，并在复杂场景下实现了显著的性能提升与良好的可扩展性。

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

ConfHit 是一种无需实验验证器（Oracle）的分布无关框架，它利用加权交换性和多重样本密度比加权共形 p 值，为药物发现中的生成式设计提供统计保证，既能认证生成批次中是否包含有效候选分子，又能将其精炼为紧凑集合。

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

本文针对低资源场景下的英译印地语机器翻译，通过对比提示策略并引入结合低秩适应与回归头的中间层微调框架（ALOPE 及其扩展 LoRMA），显著提升了医疗、法律等高风险领域句子级质量估计的鲁棒性，并公开了相关代码与数据集。

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

该论文提出了一种基于特征区分性、稀疏性（奥卡姆剃刀）及分布重叠性的原则性框架，通过形式化定理证明了稀疏假设在训练与测试分布仅部分重叠时仍能实现泛化，并将该理论推广至子空间联合分类器。

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

本文提出了名为 MARIGOLD 的统一算法框架，通过将多任务梯度平衡问题建模为利用零阶方法高效求解的双层优化问题，解决了现有 MGDA 类方法计算效率低下的局限性。

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

该论文提出了一种基于确定性双编码器与透明模糊分区的可复现法律合规分类及证据检索系统，通过结合 RoBERTa 模型在 ACORD 和 CUAD 数据集上的表现，将合规评分映射为自动决策与人工审查的明确区间，从而在满足严格错误率约束的同时，为法律团队提供了介于手工规则与黑盒大模型之间的可解释、可审计的实用解决方案。

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

本文提出了一种广义的解耦期望二次损失（DEQL）框架，不仅简化了线性自编码器推荐模型（EDLAE）的求解过程，还通过高效算法揭示了超参数 $b>0$ 时更优的闭式解，从而在基准数据集上超越了原有的 $b=0$ 基线模型。

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

该论文提出了“上下文信道容量”这一信息论框架，证明了零遗忘要求上下文信号与生成参数间存在足够的互信息，揭示了传统状态型持续学习方法的“不可能三角”局限，并指出通过架构设计（如超网络）重构参数为函数值而非状态是实现零遗忘的关键。

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

该论文针对大语言模型深度研究代理推理延迟高的问题，提出了一种基于搜索与访问动作异质性特征的“双过程”推测框架 DualSpec，通过引入轻量级语义验证器实现了高达 3.28 倍的端到端加速，同时保持了与完全推理代理相当的准确率。

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

本文提出了名为 OrthoFormer 的因果驱动架构，通过将工具变量估计嵌入 Transformer 隐藏状态并利用神经控制函数，有效解决了传统模型因混淆静态背景与动态因果流而导致的分布外泛化失败问题，实现了从相关性学习到因果推断的范式转变。

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

本文针对移动智能体在线强化学习中的泛化难题，提出了包含三种挑战模式的基准测试"AndroidWorld-Generalization"及一套集成 GRPO 算法的开源训练系统，实验表明该方法虽能显著提升模型在未见任务实例上的零样本泛化能力，但在未见模板和应用上的泛化效果仍有限，并初步验证了测试时少样本适应的潜力。

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

本文提出了 Data Agent，一种将数据选择建模为训练感知序贯决策问题的端到端动态优化框架，它通过自适应平衡损失难度与置信度不确定性的复合奖励机制，在无需人工设计指标的情况下实现了跨任务、跨架构的训练加速与性能保持。

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG