cs.LG 篇论文 | Gist.Science

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

该研究通过对比统计基线、树集成与深度学习模型在具有间歇性需求和数据缺失的零售销售数据上的表现，发现基于树的集成方法（如 XGBoost）在预测精度上优于复杂的深度学习架构，表明在特定约束下应优先考虑模型与问题特征的匹配度而非架构的复杂性。

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

该论文提出了 ReLIFT 方法，通过交替进行强化学习与在线监督微调，利用高质量演示数据弥补纯强化学习在获取新知识方面的不足，从而显著提升大语言模型在解决高难度问题上的推理能力。

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

该论文提出了“前缀可扫描模型”（PSMs）这一通用类，通过放宽状态聚合算子的限制，将 Mamba 和线性 Transformer 等架构统一起来，实现了兼具并行训练高效性与线性时间、常数空间顺序推理能力的新型序列模型。

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

这篇综述论文系统梳理了差分隐私从基础定义到在机器学习（涵盖符号人工智能至大语言模型）中的演进与集成方法，并探讨了其实践评估方案，旨在推动安全可信人工智能系统的发展。

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

本文提出了一种名为 K-Sil 的轮廓驱动 $k$ -means 变体，通过利用轮廓分数的质心边缘代理对实例进行自适应加权，在迭代中强调高置信度样本并降低边界或噪声点的影响，从而在多种真实世界数据集上实现了优于传统 $k$ -means 及现有加权基线的聚类性能。

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

本文针对零样本协调（ZSC）任务中现有基准 Hanabi 因算法表现趋近完美而难以区分进展的局限，提出了一个要求智能体在模糊线索下动态跟踪信念并推断共享知识的开源多智能体基准“妖怪学习环境”（YLE），并证明在该环境中主流 ZSC 方法存在显著的跨种子性能差距，表明单一基准的评估结果可能无法泛化。

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

本文针对高斯奖励下的随机多臂老虎机环境，提出了基于汤普森采样（TS）的夏普比率优化算法 SRTS，通过构建新颖的遗憾分解理论，证明了该算法在分布依赖下具有对数级遗憾上界且与下界匹配，从而确立了其阶最优性，并通过实验验证了其显著优于现有算法的性能。

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

该论文建立了全局脉冲控制下模拟量子模拟器实现通用量子计算的充要条件，提出了结合硬件约束的“直接量子最优控制”框架，并在里德堡原子阵列上成功实验验证了该框架在合成多体相互作用及实现拓扑动力学方面的可行性。

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

该论文提出了一种仅利用标准线性代数运算、针对沿单一模式纤维观测的张量进行快速且确定性恢复的张量列车补全方法，该方法在满足合理确定性观测条件下无需随机性假设即可保证有效重建。

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

该论文提出了一种基于函数编码器的零-shot 迁移求解方法，通过离线学习可复用的神经基函数集，实现了对不同目标的最优控制问题的高效在线自适应，从而在无需重新求解的情况下以极小开销获得近优性能。

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

该论文从理论层面解释了 SigLIP 模型中可训练逆温度与偏置项的优势，通过引入 $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -星座这一新型组合对象刻画了损失函数为零的全局最优解，从而阐明了其在检索任务中的成功、模态间隙的成因及高质量表示所需的维度，并提出了一种改进的训练重参数化方法。

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

该研究针对 MethaneSAT 和 MethaneAIR 任务的高空间分辨率数据，通过对比传统机器学习与深度学习模型，证实了 U-Net 和 SCAN 等深度学习方法在云及云阴影分割任务中显著优于传统方法，能有效提升甲烷反演的准确性。

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

该论文通过对 23 个视觉问答基准的大规模实证研究，量化分析了多模态数据中模态内与模态间依赖关系的复杂分布，揭示了当前许多旨在消除文本偏见的基准反而加剧了图像依赖，从而为多模态基准的设计与评估提供了定量依据。

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

Proposing a Framework for Machine Learning Adoption on Legacy Systems

本文提出了一种基于 API 的实用框架，通过将机器学习生命周期与生产环境解耦，使企业无需升级遗留系统或停机即可安全、低成本地部署模型，从而赋能领域专家并提升制造竞争力。

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

本文提出了 SMoPE 框架，通过将共享提示组织为稀疏混合专家（MoE）架构，利用动态专家选择、自适应噪声机制及基于原型的损失函数，在显著降低计算与存储成本的同时，有效解决了提示式持续学习中任务特定提示开销大与共享提示干扰严重的权衡问题，实现了性能与效率的双重提升。

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

RADAR 是一种受心理测量学启发的轻量级可解释路由框架，它通过学习查询难度与模型能力之间的响应模型，动态将高难度查询分配给高能力配置，从而在多个推理基准测试中实现了优于现有方法的性能与成本平衡。

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

本文提出了名为 Composer 的模块化混合神经网络架构搜索框架，通过在小规模上探索并借助扩展策略将最优架构放大，成功发现了在 350M 至 3B 参数规模下性能超越 Llama 3.2、显著提升下游任务准确率并优化训练与推理效率的新型混合大语言模型架构。

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

本文提出了 MIG-Vis 方法，通过结合变分自编码器与互信息引导的扩散模型，从灵长类颞下皮层神经群体中成功识别并可视化了具有清晰语义选择性（如物体姿态、类别间变换及类内内容）的结构化潜在子空间，从而直接揭示了高级视觉皮层中特征信息的组织原则。

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

该研究表明，在解决多智能体协作问题时，简单的通信协议比课程学习更为可靠，因为后者若设计不当（如强调背叛均衡）可能引发“习得性悲观”，从而削弱智能体的协作能力。

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

本文首次系统评估了自监督学习在可穿戴 EEG 睡眠分期中的应用，提出了一种专用流程，证明其仅需 5% 至 10% 的标注数据即可实现超过 80% 的临床级准确率，显著优于监督基线及通用 EEG 基础模型。

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

cs.LG