Diffusion Controller: Framework, Algorithms and Parameterization

该论文提出了 Diffusion Controller (DiffCon) 框架,通过控制理论视角将扩散采样统一为线性可解马尔可夫决策过程,并据此推导了高效的强化学习微调算法与轻量级侧网络参数化方法,在保持骨干网络冻结的同时显著提升了扩散模型的偏好对齐效果与质量效率。

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

VLN-Cache 通过引入视图对齐重映射和任务相关性显著性过滤机制,解决了现有 Token 缓存方法在视觉与语义动态变化下的失效问题,从而在保持导航成功率的同时显著提升了 VLN 模型的推理速度。

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG