Stochastic and incremental subgradient methods for convex optimization on Hadamard spaces

该论文针对非正曲率度量空间(Hadamard 空间)中缺乏线性结构导致次梯度构造困难的问题,提出了一种基于 Busemann 函数的新型次梯度定义,并据此构建了具有复杂度保证的随机及增量次梯度优化算法,成功应用于 BHV 树空间等场景下的 pp-均值问题求解。

Ariel Goodwin, Adrian S. Lewis, Genaro López-Acedo, Adriana NicolaeWed, 11 Ma🔢 math

Safety-Critical Control with Guaranteed Lipschitz Continuity via Filtered Control Barrier Functions

本文提出了一种结合输入正则化滤波器的滤波控制障碍函数(FCBF)框架,通过统一二次规划将高阶控制障碍函数(HOCBF)与滤波器相结合,在确保系统安全性的同时,为控制输入提供了严格的利普希茨连续性保证,从而有效避免了控制信号的突变并满足执行器限制。

Shuo Liu, Wei Xiao, Calin A. BeltaWed, 11 Ma⚡ eess

Existence and Uniqueness of Physically Correct Hydraulic States in Water Distribution Systems -- A theoretical analysis on the solvability of non-linear systems of equations in the context of water distribution systems

本文通过严格的理论分析,证明了在给定常见观测子集(如水库水头和需水量)的情况下,基于物理原理的水分配系统非线性方程组解的存在性与唯一性,从而为水力模拟器的可靠性提供了此前缺失的数学基础。

Janine Strotherm, Julian Rolfes, Barbara HammerWed, 11 Ma🔢 math

Two-Stage Stochastic Capacity Expansion in Stable Matching under Truthful or Strategic Preference Uncertainty

本文针对学校选择等实际场景中偏好不确定性(包括外生的真实偏好和策略性误报导致的内生偏好)对容量规划的影响,提出了一个两阶段随机容量扩展模型,通过样本平均近似法结合拉格朗日与局部搜索启发式算法,在考虑学生策略行为的情况下优化容量决策以提升匹配结果。

Maria Bazotte, Margarida Carvalho, Thibaut VidalWed, 11 Ma🔢 math

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

该论文在目标函数梯度满足全局γ\gamma-Hölder 连续性的参数化设定下,仅利用离散 Gronwall 不等式而非 Robbins-Siegmund 定理,推导并恢复了随机梯度下降(SGD)和随机重球法(SHB)在凸或非凸情形下最后迭代点的收敛速率,并证明了在特定条件下 SHB 能以高概率达到 O(tmax(p1,2p+1)log2tδ)O(t^{\max(p-1,-2p+1)} \log^2 \frac{t}{\delta}) 的收敛界。

Marcel HudianiWed, 11 Ma🤖 cs.LG

Robust Assortment Optimization from Observational Data

本文提出了一种基于观测数据的鲁棒 assortment 优化框架,通过建模客户偏好分布偏移并最大化最坏情况下的预期收益,在理论界定了计算可行性与样本复杂度上下界的同时,揭示了实现样本高效鲁棒学习所需的最小数据条件“鲁棒单项覆盖”,从而弥合了鲁棒性与统计效率之间的差距。

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose BlanchetWed, 11 Ma🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

本文研究了非矩形平均奖励鲁棒马尔可夫决策过程,证明了在弱通信假设下存在实现次线性期望遗憾的鲁棒最优策略,揭示了其鲁棒值的极小极大表示,并指出平均奖励最优性可能掩盖极差的瞬态表现,进而提出了一种结合最坏情况最优策略、序贯检验与在线学习回退机制的基于时段的策略,以实现常数阶的瞬态值。

Shengbo Wang, Nian SiWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

本文提出了一种基于经验分布和距离函数子水平集构建模糊集的鲁棒马尔可夫决策过程(RMDP)框架,通过连接弱收敛与距离收敛,证明了该方法在有限样本下能提供高概率的出样本性能上界及收敛速率,并指出相比之下传统的经验 MDP 无法保证此类有限样本性能。

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG