New Results on the Polyak Stepsize: Tight Convergence Analysis and Universal Function Classes
本文通过构造最坏情况函数证明了 Polyak 步长梯度下降法在平滑强凸和平滑凸函数上的已知收敛率是紧的,并揭示了其利用浮点误差逃离最坏情况的能力,同时建立了其在 Hölder 光滑与增长条件下的新收敛保证,从而证明了该算法无需先验参数即可自适应多种函数类的通用性。
337 篇论文
本文通过构造最坏情况函数证明了 Polyak 步长梯度下降法在平滑强凸和平滑凸函数上的已知收敛率是紧的,并揭示了其利用浮点误差逃离最坏情况的能力,同时建立了其在 Hölder 光滑与增长条件下的新收敛保证,从而证明了该算法无需先验参数即可自适应多种函数类的通用性。
本文介绍了用于太阳帆形状控制与动量管理的 CABLESSail 概念,通过展示其小型原型测试验证了缆索驱动的有效性,并提出了一种计算高效的新型控制分配算法,该算法在数值模拟中表现出对帆膜形状不确定性的鲁棒性,能够生成优于现有技术的动量管理力矩。
本文提出了一种基于索引分层框架的非线性半定规划理论,通过定义并刻画基于流形的正则性条件与弱二阶条件,揭示了非光滑 KKT 系统的几何结构,并设计了一种具有全局收敛性和局部二次收敛性的分层高斯 - 牛顿算法。
该论文通过构建博弈论模型,分析了非正规及私有化交通系统中司机逐利行为导致的效率损失,并提出了通过中央控制部分运力或实施交叉补贴等机制来优化系统协调与效率的解决方案,且经由印度纳拉索帕拉地区的实证数据验证了这些干预措施的有效性。
本文提出了一种针对散度下非负 CP 和 Tucker 张量分解的联合主要化 - 最小化(J-CoMM)算法,通过仅利用张量收缩操作构建可分离代理函数,在避免显式展开和大型辅助矩阵的同时,实现了计算加速并严格证明了算法的收敛性。
本文利用秩定理和李群作用构建了适用于复合与不变函数的 Kurdyka-Łojasiewicz 指数计算规则,该方法无需光滑性假设且能处理非孤立局部极小值,为矩阵分解、矩阵感知及线性神经网络等算法的线性收敛性提供了统一分析框架。
本文利用拉格朗日对偶方法,将 Kim-Omberg 模型下带无借贷约束的跨期消费投资组合优化问题转化为对偶空间中的奇异控制问题,并通过辅助的二维随机波动率最优停止问题求解,最终获得了最优策略的解析刻画及数值分析。
本文提出了一种针对具有异质服务率的空间超立方排队模型的精确几何收敛算法及其并行化方案,该方案在保持高精度的同时显著提升了计算效率,使得传统方法难以处理的大规模应急服务系统问题得以高效求解。
本文提出了一种基于神经动力学的双时间尺度方法,通过三种投影方程求解分布鲁棒几何联合机会约束优化问题,该方法无需传统求解器即可概率收敛至全局最优,并成功应用于形状优化与电信问题。
该论文提出了一种名为 OptBio 的开源两阶段随机优化模型,用于在价格和原料不确定性下制定巴西甘蔗生物燃料与生物电的投资及运营规划,并通过案例研究揭示了风险规避策略对促进产能多元化及提升项目稳健性的关键作用。
本文受自由能原理启发,提出了一种结合环境动力学与奖励学习的分布鲁棒性控制框架,通过统一探索与分布鲁棒性,显著缩小了仿真到现实的差距,实现了无需任务特定微调的可靠机器人操作。
该论文提出了一种无需在梯度计算之外额外求解偏微分方程的高斯 - 牛顿方法,成功解决了大规模偏微分方程约束反问题(如全波形反演)中计算成本高昂的难题,在保持梯度法效率的同时实现了高斯 - 牛顿法的快速收敛。
该论文证明了在凸且-光滑的目标函数及闭凸可行集约束下,Nesterov 加速梯度法中的梯度评估序列(而非常规的近似解序列)同样能达到最优的迭代复杂度,且该结论适用于非欧几里得设置。
该论文针对传统马尔可夫决策过程无法描述多动作反事实结果联合分布的局限,提出了联合马尔可夫决策过程(JMDP)这一新形式化框架,通过引入多动作采样转移模型来刻画耦合动力学环境,并推导了相应的贝尔曼算子及具有收敛保证的动态规划与增量算法。
该论文通过将单纯形法的基本几何元素扩展至局部凸拓扑向量空间,并摒弃传统的代数枢轴运算,建立了在更广泛条件下(包括希尔伯特立方体)保证算法收敛且所有多面体均具有连通极值点路径的通用框架。
本文针对大多数动量加速一阶方法不满足固定点假设的问题,提出了一种新颖的高分辨率常微分方程(ODE)框架,通过引入 分辨率深入揭示了 NAG、HB 等方法的收敛机理(特别是 Hessian 驱动的阻尼效应),并据此提出了具有全局最优收敛率保证的修正算法。
本文深入研究了不定 Stiefel 流形的二阶几何性质,推导了两种黎曼度量下的 Levi-Civita 联络并解析计算了 Hessian 矩阵,进而提出了基于线性共轭梯度法求解切空间牛顿方程的高效实现方案,并通过数值实验验证了其快速局部收敛性与实际效率。
本文提出了一种名为 IBSN 的新方法,通过结合 Bregman 近端点框架、非精确求解策略以及稀疏牛顿型求解器,在保持理论收敛性的同时显著降低了计算复杂度和内存成本,从而高效且高精度地解决了大规模精确最优传输问题。
本文针对具有一侧信息反馈和预算约束的上下文第一价格拍卖问题,提出了一种基于条件分位数不变性的稳健回归与对偶更新相结合的新算法,在对手竞价依赖未知上下文的情况下实现了最优的 累积遗憾。
本文研究了 上具有 对称性的单参数左不变洛伦兹结构族及其亚洛伦兹极限情形,重点分析了测地线的全局最优性(即最长弧)以及洛伦兹结构性质向亚洛伦兹结构性质的变形规律。