Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

该论文在目标函数梯度满足全局γ\gamma-Hölder 连续性的参数化设定下,仅利用离散 Gronwall 不等式而非 Robbins-Siegmund 定理,推导并恢复了随机梯度下降(SGD)和随机重球法(SHB)在凸或非凸情形下最后迭代点的收敛速率,并证明了在特定条件下 SHB 能以高概率达到 O(tmax(p1,2p+1)log2tδ)O(t^{\max(p-1,-2p+1)} \log^2 \frac{t}{\delta}) 的收敛界。

Marcel HudianiWed, 11 Ma🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

本文提出了名为 LangevinFlow 的序列变分自编码器,通过在下潜空间引入包含惯性、阻尼及局部耦合振荡器参数化势函数的欠阻尼朗之万动力学,有效建模了神经群体的内在动力学与外部未观测影响,并在合成数据、神经潜变量基准测试及行为解码任务中展现出优于现有最先进方法的性能。

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

本文提出了一种名为 CTRL 的元学习方法,通过结合跨域残差学习与自适应聚类技术,有效解决了多源小样本场景下的分布偏移与样本量差异问题,在提升整体预测精度的同时保留了各数据源间的异质性,并在包括瑞士庇护项目在内的多个数据集上显著优于现有基准。

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth PaulsonWed, 11 Ma🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

该论文提出了一种通过迭代示例选择策略来增强大语言模型系统泛化能力的上下文学习方法,并在代数任务中验证了该方法结合显式推理指令能有效提升模型表现,且发现使用比测试分布更简单的示例往往能带来更好的泛化效果。

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò NavarinWed, 11 Ma🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

本文提出了一种基于全连接残差神经网络的代理模型,通过训练有限元模拟数据,实现了对高温超导磁体电流分布的快速准确预测,从而显著提升了大型 REBCO 螺线管磁体的智能设计效率。

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing QuWed, 11 Ma🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

本文提出并评估了多种基于排斥性节点(如行列式点过程和排斥过程)的蒙特卡洛积分方法以计算高维球面上的切片 Wasserstein 距离,并通过方差分析揭示了 UnifOrtho 估计量在大维数下的优势,最终建议在小维数场景使用随机拟蒙特卡洛法,而在大维数场景使用 UnifOrtho 方法。

Vladimir Petrovic, Rémi Bardenet, Agnès DesolneuxWed, 11 Ma🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本文介绍了机器人控制堆栈(RCS),这是一个专为支持大规模通用策略(如 VLA)研究而设计的轻量级生态系统,它通过模块化分层架构统一了仿真与物理机器人接口,有效解决了传统框架在机器人学习工作流中的瓶颈问题,并验证了其在提升策略性能及促进虚实迁移方面的有效性。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian WalterWed, 11 Ma🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

本文提出了 ZeroSiam,一种基于非对称孪生架构的高效方法,通过非对称散度对齐机制在无需额外开销的情况下有效防止测试时熵最小化过程中的模型坍塌,从而在视觉适应和大语言模型推理任务中实现更稳定且优越的性能。

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi ShenWed, 11 Ma🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

该论文提出了一种名为通用策略组合(GPC)的免训练方法,通过凸组合多个预训练扩散或流匹配策略的分布分数,在无需额外模型训练的情况下显著提升了机器人控制性能与适应性。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. LuoWed, 11 Ma🤖 cs.LG