Learning Risk Preferences in Markov Decision Processes: an Application to the Fourth Down Decision in the National Football League

该论文利用逆优化方法,将美式橄榄球第四档决策建模为马尔可夫决策过程,通过分析 2014 至 2022 年的比赛数据,发现教练的决策行为符合保守的风险偏好(即优化低分位数),且其风险容忍度在对方半场更高并随时间推移呈上升趋势。

Nathan Sandholtz, Lucas Wu, Martin Puterman + 1 more2026-03-06🔢 math

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

本文针对具有耦合线性约束的非凸极小极大问题,提出了两种单循环零阶算法(ZO-PDAPG 和 ZO-RMPDPG),并在确定性和随机设定下分别证明了其达到ε\varepsilon-平稳点的迭代复杂度,填补了该领域零阶算法理论分析的空白,其中 ZO-RMPDPG 在无约束随机设定下还刷新了现有零阶算法的最优复杂度记录。

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Randomized Greedy Methods for Weak Submodular Sensor Selection with Robustness Considerations

本文针对弱次模传感器选择中的预算与性能约束问题,提出了 Modified Randomized Greedy 和 Dual Randomized Greedy 两种随机贪婪算法及其在鲁棒优化中的扩展 Random-WSSA 算法,并推导了高概率近似保证,同时通过低地球轨道卫星星座的地球观测应用验证了这些方法的有效性。

Ege C. Kaya, Michael Hibbard, Takashi Tanaka + 2 more2026-03-06🔢 math

Lyapunov Characterization for ISS of Impulsive Switched Systems

本文针对具有稳定与不稳定模态流的脉冲切换系统,在满足模态依赖平均驻留时间和停留时间条件下,通过提出非增与递减两类时变 ISS-Lyapunov 函数,证明了其存在性是系统输入状态稳定(ISS)的充要条件,并给出了从非增函数构造递减函数的方法以及针对未知切换信号的 ISS 保证策略。

Saeed Ahmed, Patrick Bachmann, Stephan Trenn2026-03-06🔢 math