cs.LG 篇论文 | Gist.Science

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

该论文提出了一种基于常时滞神经延迟微分方程（NDDEs）的框架，通过借鉴 Mori-Zwanzig 形式体系将隐藏变量转化为记忆项，从而在部分可观测条件下高效地学习非马尔可夫动力学系统。

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Open-World Reinforcement Learning over Long Short-Term Imagination

该论文提出了 LS-Imagine 方法，通过构建长短期世界模型并模拟目标导向的跳跃状态转移，有效扩展了视觉强化学习智能体的想象视野，从而显著提升了 MineDojo 等开放世界环境中长程决策的探索效率。

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG

How Learning Dynamics Drive Adversarially Robust Generalization?

该论文通过将动量 SGD 对抗训练视为离散时间动力系统并引入 PAC-Bayes 分析框架，从学习动态角度揭示了鲁棒过拟合的机制，并解释了鲁棒权重扰动在抑制损失曲率与优化效率之间的权衡。

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

该论文表明，在无需测试时梯度更新或显式系统模型的情况下，基于上下文学习的 Transformer 能够隐式推断隐藏状态，从而在从线性高斯到非线性等各种动态系统中实现媲美卡尔曼滤波及粒子滤波等经典方法的输出预测性能。

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

本文提出了一种名为自适应迁移聚类（ATC）的统一框架，该算法通过优化偏差 - 方差分解，能够在主数据集与辅助数据集存在未知差异的情况下自动利用共性，从而在包括高斯混合模型在内的多种统计模型中实现最优的聚类效果并量化迁移收益。

Yuqi Gu, Zhongyuan Lyu, Kaizheng Wang2026-03-10🤖 cs.LG

A Learned Proximal Alternating Minimization Algorithm and Its Induced Network for a Class of Two-block Nonconvex and Nonsmooth Optimization

本文提出了一种用于求解双块非凸非光滑优化问题的学习近端交替最小化算法（LPAM）及其对应的可解释网络（LPAM-net），通过结合平滑技术、残差学习与块坐标下降策略证明了算法的收敛性，并在联合多模态 MRI 重建任务中展现了参数高效与优越的性能。

Yunmei Chen, Lezhi Liu, Lei Zhang2026-03-10🤖 cs.LG

Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging

该论文提出了一种通过重建视觉基元来学习高层结构解释的神经符号系统，其在组织病理学图像异常诊断任务中不仅比传统深度学习架构具有更高的分类准确率，还具备更强的可解释性。

Zuzanna Buchnajzer, Kacper Dobek, Stanisław Hapke, Daniel Jankowski, Krzysztof Krawiec2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

该论文提出了 Puppet-CNN 框架，通过将卷积层参数建模为受神经微分方程控制的连续动态系统，实现了根据输入复杂度自适应调整有效层数，从而在保持竞争力的同时显著减少了可训练参数。

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

该论文提出了一种输入自适应生成动力学框架，通过训练扩散模型适应不同的生成轨迹，使其能根据样本复杂度动态调整生成过程，从而在保持图像生成质量的同时减少平均采样步数。

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

本文提出了一种基于聚类分析的步态任务集优化策略，通过筛选最小且具代表性的任务组合来训练神经网络，在显著降低数据采集成本的同时，实现了与使用全量任务集相当的髋关节力矩估计精度。

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG

Finite Sample Bounds for Non-Parametric Regression: Optimal Sample Efficiency and Space Complexity

该论文提出了一种基于有限维表示的轻量级参数化方法，用于从含噪点观测中估计光滑函数及其导数，该方法不仅实现了极小极大最优的一致收敛速率和内存效率，还通过推导有限样本界与下界证明了其最优性，从而克服了传统核估计器在实时应用中计算与存储成本过高的问题。

Davide Maran, Marcello Restelli2026-03-10🤖 cs.LG

GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications

本文综述了生成式扩散模型（GDM）在大规模 MIMO 通信中的应用潜力，通过概述相关框架与机制、展示近场信道估计案例，并探讨未来挑战与研究方向，论证了其在高效获取超维信道状态信息方面的前景。

Zhenzhou Jin, Li You, Huibin Zhou + 6 more2026-03-10⚡ eess

Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control

该论文通过引入嵌入先验并分析提示微调中嵌入坍塌现象，发现模型能在激活空间的不同区域有效工作，且不同任务类型的激活轨迹呈现特定聚类模式，从而为提升提示微调的可解释性、可控性及泛化能力提供了新见解。

Sergey Sedov, Sumanth Bharadwaj Hachalli Karanam, Venu Gopal Kadamba2026-03-10🤖 cs.LG

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

该论文提出了一种利用预训练视觉 - 语言模型（VLM）从少量演示中学习抽象符号世界模型的方法，通过自动构建和筛选谓词，使机器人能够在未见过的复杂场景中实现零样本泛化，从而解决长视野的决策规划问题。

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

本文提出了 UFGraphFR，一种基于用户文本描述特征的联邦推荐框架，该框架通过将私有数据转化为语义向量来在保护隐私的前提下重构全局用户关系图，并结合 Transformer 架构优化个性化行为序列，从而在多个基准数据集上显著提升了推荐精度与个性化水平。

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

该论文提出了一种基于潜在聚类的数据缩减策略，通过从决策边界附近智能筛选或生成关键样本，在大幅降低半监督对抗训练（SSAT）所需数据量和计算成本的同时，保持了与全量训练相当的鲁棒性。

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

本文针对深度学习框架下的噪声标签分类问题，通过独立块构造处理统计依赖并推广至向量值设定，在低维流形假设下推导了包含统计误差与逼近误差的超额风险误差界。

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

本文提出了一种名为生成预测控制（GPC）的框架，该框架通过结合专家演示克隆的生成策略、基于探索数据训练的预测世界模型以及利用模型进行前瞻优化的在线规划器，在多种仿真与真实世界的机器人操作任务中显著超越了传统的行为克隆方法。

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

本文针对分布式计算中服务器独立以概率 $p$ 发生延迟的通用编码计算场景，理论证明了 BACC 和 LeTCC 两种方案的平均近似误差均能以特定速率收敛至零，并通过实验验证了该结论在包括深度神经网络在内的多种任务中的有效性。

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

该论文提出了一种名为 GRADIEND 的新型编码器 - 解码器方法，利用模型梯度学习编码社会偏见（如性别、种族和宗教）的特征神经元，从而能够精准定位并修改模型权重以在保留其他能力的同时消除偏见。

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG