Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

该研究通过对比统计基线、树集成与深度学习模型在具有间歇性需求和数据缺失的零售销售数据上的表现,发现基于树的集成方法(如 XGBoost)在预测精度上优于复杂的深度学习架构,表明在特定约束下应优先考虑模型与问题特征的匹配度而非架构的复杂性。

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

该论文提出了 ReLIFT 方法,通过交替进行强化学习与在线监督微调,利用高质量演示数据弥补纯强化学习在获取新知识方面的不足,从而显著提升大语言模型在解决高难度问题上的推理能力。

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

本文针对零样本协调(ZSC)任务中现有基准 Hanabi 因算法表现趋近完美而难以区分进展的局限,提出了一个要求智能体在模糊线索下动态跟踪信念并推断共享知识的开源多智能体基准“妖怪学习环境”(YLE),并证明在该环境中主流 ZSC 方法存在显著的跨种子性能差距,表明单一基准的评估结果可能无法泛化。

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

本文针对高斯奖励下的随机多臂老虎机环境,提出了基于汤普森采样(TS)的夏普比率优化算法 SRTS,通过构建新颖的遗憾分解理论,证明了该算法在分布依赖下具有对数级遗憾上界且与下界匹配,从而确立了其阶最优性,并通过实验验证了其显著优于现有算法的性能。

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

该论文建立了全局脉冲控制下模拟量子模拟器实现通用量子计算的充要条件,提出了结合硬件约束的“直接量子最优控制”框架,并在里德堡原子阵列上成功实验验证了该框架在合成多体相互作用及实现拓扑动力学方面的可行性。

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Global Minimizers of Sigmoid Contrastive Loss

该论文从理论层面解释了 SigLIP 模型中可训练逆温度与偏置项的优势,通过引入(m,brel)(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})-星座这一新型组合对象刻画了损失函数为零的全局最优解,从而阐明了其在检索任务中的成功、模态间隙的成因及高质量表示所需的维度,并提出了一种改进的训练重参数化方法。

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

本文提出了 SMoPE 框架,通过将共享提示组织为稀疏混合专家(MoE)架构,利用动态专家选择、自适应噪声机制及基于原型的损失函数,在显著降低计算与存储成本的同时,有效解决了提示式持续学习中任务特定提示开销大与共享提示干扰严重的权衡问题,实现了性能与效率的双重提升。

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

Composer: A Search Framework for Hybrid Neural Architecture Design

本文提出了名为 Composer 的模块化混合神经网络架构搜索框架,通过在小规模上探索并借助扩展策略将最优架构放大,成功发现了在 350M 至 3B 参数规模下性能超越 Llama 3.2、显著提升下游任务准确率并优化训练与推理效率的新型混合大语言模型架构。

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

本文提出了 MIG-Vis 方法,通过结合变分自编码器与互信息引导的扩散模型,从灵长类颞下皮层神经群体中成功识别并可视化了具有清晰语义选择性(如物体姿态、类别间变换及类内内容)的结构化潜在子空间,从而直接揭示了高级视觉皮层中特征信息的组织原则。

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio