Ergodic McKean-Vlasov Games: Verification Theorems and Linear-Quadratic Applications
本文研究了具有 McKean-Vlasov 动力学的两人遍历非零和随机微分博弈,建立了连接耦合主方程解与纳什均衡的验证定理,并在线性二次高斯(LQG)设定下推导出了显式解。
338 篇论文
本文研究了具有 McKean-Vlasov 动力学的两人遍历非零和随机微分博弈,建立了连接耦合主方程解与纳什均衡的验证定理,并在线性二次高斯(LQG)设定下推导出了显式解。
本文提出了一种专为嵌入式实时凸优化(特别是现代制导与控制应用)定制的二次锥规划求解器,该方法结合预测 - 校正原对偶内点法与齐次嵌入框架,能够直接处理二次目标函数以避免稀疏性损失,并配套开发了基于问题稀疏性分析的代码生成工具,最终在嵌入式平台上的实验表明其性能优于现有求解器。
本文针对 Bredies、Chenchene 和 Naldi 提出的图分裂方法,建立了算子不动点的通用分析框架,并在算子为闭线性子空间法锥的情形下导出了极限点的显式公式,从而统一并拓展了相关算法的既有结论。
该论文提出了一种仅利用标准线性代数运算、针对沿单一模式纤维观测的张量进行快速且确定性恢复的张量列车补全方法,该方法在满足合理确定性观测条件下无需随机性假设即可保证有效重建。
该论文提出了一种基于函数编码器的零-shot 迁移求解方法,通过离线学习可复用的神经基函数集,实现了对不同目标的最优控制问题的高效在线自适应,从而在无需重新求解的情况下以极小开销获得近优性能。
本文提出了一种针对离散时间优化算法的分析与综合方法,通过求解线性矩阵不等式并结合 Zames-Falb 滤波器系数,实现了在存在时变延迟和不稳定信道动态的切换网络环境下具有指数收敛率保证的鲁棒优化算法设计。
本文针对一类由椭圆偏微分方程 Neumann 边值问题约束且控制量作用于方程右端的边界值跟踪最优控制问题,通过将其重构为基于状态的变分问题,采用张量积有限元离散化方法推导了最优误差估计与快速求解器,并通过数值实验验证了理论结果。
本文研究了包含单个领导者和连续体追随者的领导者 - 追随者线性二次随机图论博弈,建立了分层决策模型,证明了状态方程解的存在唯一性,并构造了追随者纳什均衡下的 Stackelberg-Nash 均衡,同时利用连续性方法确立了相关含图论聚合项的前向 - 后向随机微分方程解的存在性、唯一性与稳定性。
本文提出了一种名为 VR-SDA-A 的新型自适应方差缩减算法,通过结合 STORM 动量机制与同批曲率验证技术,成功突破了随机变分不等式中的随机性障碍,在无需手动调节学习率的情况下实现了与非凸最小化问题最优的 oracle 复杂度。
该论文针对交换随机变量之和,建立了具有反对称性的霍夫丁型浓度不等式,其尾部界限分别由德·菲内蒂混合测度支撑集中分布的最大和最小均值界定,从而填补了有限样本均值与总体均值之间的理论空白。
本文提出了一种用于求解具有随机目标函数及确定性非线性约束优化问题的信任域内点随机序列二次规划(TR-IP-SSQP)方法,该方法通过构建满足自适应精度条件的随机 Oracle 并结合内点法处理不等式约束,在标准假设下证明了其几乎处处收敛到一阶驻点,并在 CUTEst 测试集和逻辑回归问题上验证了其实际性能。
本文从控制理论视角出发,将社交网络推荐系统设计为状态反馈最优控制问题,通过构建包含对齐、极化惩罚及多样性正则化的性能指标,证明了在满足特定代数谱条件时可实现系统稳定,并揭示了过度奖励参与度可能导致系统失稳的病态行为。
该论文提出了一种基于均值 - 方差度量的分布鲁棒控制新方法,通过引入特定分布距离的惩罚项将半无限规划问题转化为可解的折扣均值 - 方差优化问题,从而在无需处理半无限规划的情况下实现了线性二次调节器框架下的最优控制律求解。
本文研究了如何通过选择最优的两块划分来加速有限马尔可夫链的混合,建立了 KL 散度与 Frobenius 距离目标与投影链之间的显式联系,将划分选择重构为具有差分子模分解的结构化组合优化问题,并提出了多种高效的近似算法以替代穷举搜索。
本文通过引入熵正则化技术,证明了探索性均衡 HJB 方程经典解的存在性,并建立了当正则化消失时其解向广义均衡 HJB 方程弱解的收敛性,从而在不依赖强正则性假设的情况下,为连续时间非指数贴现下的时间不一致随机控制问题提供了新的均衡存在性理论。
本文研究了带状矩阵(特别是三角矩阵和新定义的双对角西南矩阵)的线性互补性,通过符号模式和行列式刻画了 Q-性质,给出了所有 2 阶 Q-矩阵的完整描述,并将相关结果推广至欧几里得若尔当代数中秩一线性变换的 Q-性质判定。
该论文提出了一种具有全局收敛性的单调 Hessian-Riemannian 流来解决时变平均场博弈的正向问题,并构建了一个基于隐式微分的求解器无关框架,通过伴随法与高斯 - 牛顿加速高效求解参数估计等逆向问题。
该论文针对服务系统配置优化中 LLM 自动评分存在偏差而人工审核成本高昂的问题,提出了一种名为 PP-LUCB 的序贯决策算法,通过结合代理分数与逆倾向加权残差估计,在显著降低人工审计成本的同时,以高置信度准确识别出最优服务配置。
本文研究了双曲系统中的特征值映射与双曲性锥,证明了在存在缩放 Jordan 基的条件下,双曲多项式及其导数多项式均为最小多项式,并进一步揭示了标准 Jordan 基的正交性结构以及相应的 Schur 型优超结果。
本文提出了一种基于拓扑条件的理论框架,证明在集值映射满足外半连续且局部紧致的假设下,其半局部稳定性模(Lipschitz 上上半连续性模)可精确由局部平静度模的上确界确定,从而解决了非凸情形下该模难以计算的问题,并实现了半局部误差界的精确点态化求解。