Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

本文证明了在温和的正则性条件下,分数匹配扩散模型能够利用数据的内在低维结构(通过(p,q)(p,q)-Wasserstein 维度刻画),在无需紧支集或流形假设的情况下,以优于环境维度的收敛速率学习未知分布,从而有效缓解了维数灾难并建立了与生成对抗网络及最优传输理论的深刻联系。

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

本文针对逆上下文多臂老虎机问题,提出了一种名为“两阶段后缀模仿”的框架,通过舍弃初始探索阶段数据并仅利用后续模仿阶段数据进行经验风险最小化,成功使无法获取奖励的观察者能够从非平稳的动作数据中以O~(1/N)\tilde O(1/\sqrt{N})的收敛速率恢复最优策略,实现了与完全知晓奖励的学习者相当的性能。

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG