Transposition Approach to Optimal Control of McKean-Vlasov SPDEs
本文针对系数依赖于状态过程分布的非凸控制集 McKean-Vlasov 随机偏微分方程最优控制问题,结合尖峰变分法与涉及概率测度 Lions 导数的伴随反向随机偏微分方程,建立了 Pontryagin 型随机极大值原理,从而将该原理从有限维随机微分方程推广至无限维随机偏微分方程情形。
342 篇论文
本文针对系数依赖于状态过程分布的非凸控制集 McKean-Vlasov 随机偏微分方程最优控制问题,结合尖峰变分法与涉及概率测度 Lions 导数的伴随反向随机偏微分方程,建立了 Pontryagin 型随机极大值原理,从而将该原理从有限维随机微分方程推广至无限维随机偏微分方程情形。
该论文通过解析基于 softmax 的梯度流动力学,揭示了优化过程会内在驱动模型输出趋向低熵解,从而为 Transformer 中注意力集中和巨大激活等实证现象提供了理论解释。
本文针对去除时间窗约束的线路式动态车辆调度问题(liDARP without TWs),提出了一种基于生成停靠模式的新混合整数规划模型及分支定价算法,并设计了根节点启发式策略,在大规模实例中实现了快速求解且显著优于现有最先进方法。
该论文通过信息论视角重新诠释 NP 问题中的见证者发现,指出在完全无结构的“伪随机”探测模型下,由于多项式次探测所能获取的互信息量远不足以消除不确定性,从而揭示了指数级搜索复杂性的信息论根源。
本文提出了首个无需全局平滑常数或线搜索的自适应投影自由框架 ALFCG,通过自归一化累加器估计局部平滑度,在随机复合非凸优化中实现了优于现有方法的迭代复杂度并展现出卓越的性能。
该论文提出了通过坐标下降法最小化狄利克雷能量来计算马尔可夫链平稳分布的优化框架,从而阐明了“红灯绿灯”(RLGL)算法的行为、证明了特定链的指数收敛性,并提出了加速收敛的实用调度策略。
本文利用集合分离技术,证明了在控制拓扑下,基于迭代李括号的“高阶正规性”足以确保具有无界控制的脉冲扩展系统不存在极小值间隙。
该论文通过引入新的 Lyapunov 型函数,证明了 Popov 算法在求解广义单调变分不等式时,有约束情形下的步长上界为 $1/(2L)1/(\sqrt{3}L)$,且这两个上界均是最优紧的。
本文提出了一种针对多智能体编队控制的隐私与网络协同设计框架,通过联合优化通信拓扑与差分隐私水平,在保障轨迹隐私的同时有效平衡了系统性能与网络连通性。
本文提出并分析了用于求解对称锥上目标函数梯度非利普希茨连续的一类凸优化问题的广义乘性梯度(GMG)方法,证明了其具有 的收敛速率,建立了相关独立引理,并通过数值实验表明该方法在多种重要应用场景下具有最优或接近最优的计算复杂度。
本文提出了一种基于 Wasserstein 模糊集的分布鲁棒机场地面等待问题框架,通过结合 Kelly 割平面法与整数 L 形法及新颖的对偶二分和原问题恢复算法,显著提升了算法求解效率,并验证了该模型在应对机场容量分布偏移时具有卓越的样本外鲁棒性。
该论文利用逆优化方法,将美式橄榄球第四档决策建模为马尔可夫决策过程,通过分析 2014 至 2022 年的比赛数据,发现教练的决策行为符合保守的风险偏好(即优化低分位数),且其风险容忍度在对方半场更高并随时间推移呈上升趋势。
本文针对具有耦合线性约束的非凸极小极大问题,提出了两种单循环零阶算法(ZO-PDAPG 和 ZO-RMPDPG),并在确定性和随机设定下分别证明了其达到-平稳点的迭代复杂度,填补了该领域零阶算法理论分析的空白,其中 ZO-RMPDPG 在无约束随机设定下还刷新了现有零阶算法的最优复杂度记录。
本文提出了正交数据协作(ODC)方法,通过强制秘密基与目标基的正交性将数据协作中的基对齐问题转化为具有闭式解的正交 Procrustes 问题,从而在保持隐私和单轮通信的前提下,显著降低了计算复杂度并提升了数值稳定性与模型精度。
本文针对受扰非线性系统提出了鲁棒控制 Lyapunov 价值函数(R-CLVF)理论,通过哈密顿 - 雅可比可达性分析定义了最小鲁棒控制不变集与指数稳定区域,并引入预热启动和系统分解技术以克服维度灾难,从而实现了在用户指定指数速率下对系统的鲁棒稳定控制。
本文针对弱次模传感器选择中的预算与性能约束问题,提出了 Modified Randomized Greedy 和 Dual Randomized Greedy 两种随机贪婪算法及其在鲁棒优化中的扩展 Random-WSSA 算法,并推导了高概率近似保证,同时通过低地球轨道卫星星座的地球观测应用验证了这些方法的有效性。
本文提出了一种基于局部分布鲁棒性的多任务子模优化新方法,通过引入相对熵正则化项将问题转化为可高效求解的单调函数与子模函数复合形式,从而在卫星星座传感器选择和图像摘要等任务中实现了性能与鲁棒性的有效平衡。
本文通过结合半凹函数性质与粘性解理论,证明了希尔伯特空间中一类奇异随机控制问题的值函数是变分不等式的粘性解,并在特定条件下确立了控制方向上的二阶光滑贴合原理。
本文研究了具有离散不可逆决策的在线学习与优化问题,通过证明分类器收敛性并推导渐近最优算法,揭示了在有限时间范围内通过“先探索后利用”策略实现设施覆盖目标时,其遗憾值随目标规模呈次线性增长且收敛速度极快的理论特性。
本文针对具有稳定与不稳定模态流的脉冲切换系统,在满足模态依赖平均驻留时间和停留时间条件下,通过提出非增与递减两类时变 ISS-Lyapunov 函数,证明了其存在性是系统输入状态稳定(ISS)的充要条件,并给出了从非增函数构造递减函数的方法以及针对未知切换信号的 ISS 保证策略。