Path Planning for Masked Diffusion Model Sampling

该论文提出了一种名为“路径规划”(Path Planning, P2)的新型推理采样策略,通过将生成步骤分解为规划与去噪两个子阶段,使掩码扩散模型能够迭代优化已生成的令牌,从而在理论上扩展了证据下界,并在蛋白质、RNA、数学推理、故事生成及代码生成等多个领域实现了显著的性能提升。

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

该论文通过 2-Wasserstein 梯度流分析,证明了在使用 Lipschitz 连续激活函数训练浅层神经网络时,优化过程中的种群风险衰减速度受限于 t4rd2rt^{-\frac{4r}{d-2r}}(或针对特定局部 Lipschitz 函数的 t(4+2δ)rd2rt^{-\frac{(4+2\delta)r}{d-2r}}),从而揭示了目标函数光滑度与神经网络优化中维度灾难之间的内在联系。

Sanghoon Na, Haizhao Yang2026-03-06🔢 math