cs.LG 篇论文 | Gist.Science

Pure Exploration with Infinite Answers

该论文研究了答案集可能为无限的纯探索问题，推导了实例依赖的下界，指出了现有方法在渐近最优性上的局限，并提出了一种名为“粘性序列 Track-and-Stop"的通用框架以实现渐近最优。

Riccardo Poiani, Martino Bernasconi, Andrea Celli2026-03-11🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

本文提出了名为 TSRating 的统一框架，通过利用大语言模型（LLM）的预训练知识进行质量判断，并结合元学习与 signSGD 优化策略训练专用评分模型 TSRater，从而实现对跨领域多样化时间序列数据的高效、准确且具备强适应性的质量评级。

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong Ng2026-03-11🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

本文提出了名为 CORA 的基于合作博弈论核心分配的多智能体强化学习信用分配方法，通过评估联盟边际贡献并结合截断双 Q 学习来高效估算联盟优势，从而解决传统全局优势共享导致的优化不足问题，在多个基准测试中显著提升了多智能体协作性能。

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang Li2026-03-11🤖 cs.AI

Regret-Optimal Q-Learning with Low Cost for Single-Agent and Federated Reinforcement Learning

该论文提出了两种新型无模型强化学习算法（Q-EarlySettled-LowCost 和 FedQ-EarlySettled-LowCost），首次同时实现了近最优遗憾、关于状态与动作数量的线性预热成本以及对数级策略切换或通信开销，从而显著降低了单智能体及联邦强化学习中的实际部署代价。

Haochen Zhang, Zhong Zheng, Lingzhou Xue2026-03-11🤖 cs.LG

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

该论文提出了名为 ChannelTokenFormer 的 Transformer 框架，旨在通过统一处理通道依赖、异步采样和缺失值这三大现实挑战，显著提升多变量时间序列预测在复杂真实场景下的鲁棒性与准确性。

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup Kim2026-03-11🤖 cs.AI

Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning

本文提出了名为 WAFFLE 的检测算法，利用小波散射变换或傅里叶变换在联邦学习训练前生成低维压缩表征，从而在不访问原始数据的情况下有效识别并剔除恶意客户端，显著提升了模型性能。

Alessandro Licciardi, Davide Leo, Davide Carbone2026-03-11🤖 cs.LG

Uncovering Social Network Activity Using Joint User and Topic Interaction

本文提出了一种名为“交互级联混合模型”（MIC）的标记多维霍克斯过程模型，通过联合刻画用户行为与多个信息级联间的复杂相互作用，在模拟信息传播及揭示社交网络活动方面展现出优于现有方法的性能。

Gaspard Abel, Argyris Kalogeratos, Jean-Pierre Nadal, Julien Randon-Furling2026-03-11🤖 cs.LG

ConLID: Supervised Contrastive Learning for Low-Resource Language Identification

该论文提出了一种名为 ConLID 的有监督对比学习方法，旨在通过学习域不变表示来解决低资源语言在单一领域数据（如《圣经》）上表现不佳的问题，从而在保持高资源语言性能的同时，显著提升了低资源语言在跨域数据上的语言识别准确率。

Negar Foroutan, Jakhongir Saydaliev, Ye Eun Kim, Antoine Bosselut2026-03-11🤖 cs.AI

Global Convergence of Iteratively Reweighted Least Squares for Robust Subspace Recovery

本文证明了在确定性条件下，带有动态平滑正则化的迭代重加权最小二乘法（IRLS）变体能够从任意初始化线性全局收敛至真实子空间，填补了该算法在鲁棒子空间恢复及非凸流形优化领域缺乏理论保证的空白，并将其应用扩展至仿射子空间估计与神经网络训练。

Gilad Lerman, Kang Li, Tyler Maunu, Teng Zhang2026-03-11🤖 cs.LG

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

本文针对小基站网络中边缘服务放置问题，提出了一种基于线性多臂赌博机模型的分布式自适应多智能体最优臂识别算法，通过基站协作在有限置信度下高效确定能最小化用户延迟的最优服务，并实现了随基站数量增加而线性加速的学习效率。

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

该论文在目标函数梯度满足全局 $\gamma$ -Hölder 连续性的参数化设定下，仅利用离散 Gronwall 不等式而非 Robbins-Siegmund 定理，推导并恢复了随机梯度下降（SGD）和随机重球法（SHB）在凸或非凸情形下最后迭代点的收敛速率，并证明了在特定条件下 SHB 能以高概率达到 $O(t^{\max(p-1,-2p+1)} \log^2 \frac{t}{\delta})$ 的收敛界。

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

该研究系统评估了多种 DeepONet 架构在土力学固结问题中的应用，提出并验证了一种引入傅里叶特征的改进模型（Model 4），该模型在三维场景中实现了高达 1000 倍的速度提升，有效加速了不确定性量化并推动了科学机器学习在岩土工程中的集成应用。

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

本文提出了名为 LangevinFlow 的序列变分自编码器，通过在下潜空间引入包含惯性、阻尼及局部耦合振荡器参数化势函数的欠阻尼朗之万动力学，有效建模了神经群体的内在动力学与外部未观测影响，并在合成数据、神经潜变量基准测试及行为解码任务中展现出优于现有最先进方法的性能。

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

该论文提出了一种名为“潜在策略引导”（LPS）的方法，通过利用光流作为跨具身无关的动作表示来预训练世界模型，并结合目标具身的小规模演示数据进行微调与价值函数学习，从而在低数据场景下显著提升了机器人视觉运动策略的性能。

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

该论文提出了一种名为 MLES 的新方法，通过结合多模态大语言模型与进化搜索，利用视觉反馈驱动行为分析来自动生成透明、可验证且性能媲美传统强化学习算法的程序化控制策略。

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

本文提出了一种名为 CTRL 的元学习方法，通过结合跨域残差学习与自适应聚类技术，有效解决了多源小样本场景下的分布偏移与样本量差异问题，在提升整体预测精度的同时保留了各数据源间的异质性，并在包括瑞士庇护项目在内的多个数据集上显著优于现有基准。

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

该论文提出了一种利用开源工具 HeyGem 将课程大纲转化为虚拟化身演唱歌曲的创新方法，旨在通过更具吸引力的视听形式提升学生对课程信息的关注度、情感连接及记忆效果。

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

本文提出了名为 MuFlex 的可扩展开源平台，该平台通过结合 EnergyPlus 和 Modelica 等详细物理模型与 OpenAI Gym 接口，解决了现有测试床在模拟多建筑灵活性协调时的局限性，并验证了其在利用强化学习算法降低聚合峰值需求方面的有效性。

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

该论文提出了一种轻量级且数据高效的图神经网络框架，通过融合射频集成电路领域知识的特征索引与器件终端图抽象，实现了跨拓扑结构的主动射频电路性能高精度预测，其平均相对误差仅为 3.45%，显著优于现有最先进方法。

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

该论文提出了一种通过迭代示例选择策略来增强大语言模型系统泛化能力的上下文学习方法，并在代数任务中验证了该方法结合显式推理指令能有效提升模型表现，且发现使用比测试分布更简单的示例往往能带来更好的泛化效果。

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG