math.OC 篇论文 | Gist.Science

Dynamically optimal portfolios for monotone mean--variance preferences

本文在独立收益资产价格模型下，首次完整刻画了满足理性排序的单调均值方差（MMV）效用下的动态最优投资组合，在弱于等价鞅测度存在性且无矩限制的条件下，建立了 MMV 效用与单调夏普比率之间的联系，并给出了均值方差有效组合成为 MMV 有效组合的充要条件。

Aleš Černý, Johannes Ruf, Martin Schweizer2026-03-09🔢 math

Mean Field Games with Reflected Dynamics

该论文利用松弛控制和鞅问题框架，证明了涉及反射随机微分方程的一类平均场博弈均衡的存在性。

Imane Jarni, Ayoub Laayoun, Badr Missaoui2026-03-09🔢 math

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

本文针对线性系统求解中因定义域无界导致的收敛分析难题，提出了一种变体 Polyak 步长策略，在无需限制性假设的情况下证明了熵镜像下降法的收敛性，强化了 $\ell_1$ 范数隐式偏差的界，并推广至任意凸 $L$ -光滑函数，同时提出了一种避免指数运算的替代算法。

Yura Malitsky, Alexander Posch2026-03-09🤖 cs.LG

Optimized Fish Locomotion using Design-by-Morphing and Bayesian Optimization

该研究提出了一种结合形态设计与贝叶斯优化的计算框架，通过优化波动游泳模式、波长和频率，显著提升了二维波动游泳者的推进效率（较传统模式提高 16% 至 35%），为自主水下推进系统及仿生运动设计提供了高效的新策略。

Hamayun Farooq, Imran Akhtar, Muhammad Saif Ullah Khalid, Haris Moazam Sheikh2026-03-09🔬 physics

Dependent Reachable Sets for the Constant Bearing Pursuit Strategy

本文针对采用反馈策略的追逃场景，以常值方位（Constant Bearing）追击策略为例，提出了“依赖可达集”这一新概念，通过理论推导给出了其几何边界，并借助仿真验证了其形状特征。

Venkata Ramana Makkapati, Tulasi Ram Vechalapu, Vinodhini Comandur, Seth Hutchinson2026-03-09🔢 math

Smoothing-Enabled Randomized Stochastic Gradient Schemes for Solving Nonconvex Nonsmooth Potential Games under Uncertainty

本文提出了一种随机平滑随机梯度（RS-RSG）算法，用于在不确定性下求解非凸非光滑势博弈，并证明了该算法在无需严格增长条件或局部凸性假设的情况下，能够以最优样本复杂度收敛至平滑博弈的均衡点。

Zhuoyu Xiao2026-03-09🔢 math

StochasticBarrier.jl: A Toolbox for Stochastic Barrier Function Synthesis

本文介绍了 StochasticBarrier.jl，这是一个基于 Julia 的开源工具箱，利用半定规划、线性规划和梯度下降等优化方法为含高斯噪声的离散随机系统生成随机屏障函数，并在计算速度、安全概率界及可扩展性方面显著优于现有工具。

Rayan Mazouz, Frederik Baymler Mathiesen, Luca Laurenti, Morteza Lahijanian2026-03-09🔢 math

Quantum thermodynamics and semidefinite programming: regularization and algorithms

本文研究了受有限测量结果约束的正温量子热力学变分问题，通过引入非对易最优输运方法构建了一般化的正则化框架并分析其对偶形式，进而将其应用于量子态层析与量子最优输运，并探讨了相关算法的收敛性。

Emanuele Caputo, Augusto Gerolin, Nataliia Monina, Pavlo Pelikh, Lorenzo Portinale2026-03-09🔢 math

Marking Data-Informativity and Data-Driven Supervisory Control of Discrete-Event Systems

本文针对模型未知的离散事件系统，提出了“标记数据信息性”这一新概念及其验证算法，并进一步定义了受限标记数据信息性与标记可信息化，从而在数据驱动框架下解决了满足给定规范的非阻塞标记监督控制设计问题。

Yingying Liu, Kuma Fuchiwaki, Kai Cai2026-03-09🔢 math

A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

本文提出了一种结合铁路专用启发式方法与 Q 学习的混合启发式强化学习（HHRL）框架，通过将双端接入、双机车协同的铁路调车问题分解为单侧接入子问题，有效提升了复杂调车场景下的求解效率与质量。

Ruonan Zhao, Joseph Geunes2026-03-09🤖 cs.LG

Decision-dependent distributionally robust standard quadratic optimization with Wasserstein ambiguity

本文研究了基于 Wasserstein 距离的分布鲁棒标准二次优化问题，证明了其等价于一个修改后的确定性标准二次优化实例，并提供了样本外性能保证及实验验证。

Immanuel M. Bomze, Daniel de Vicente, Abdel Lisser, Heng Zhang2026-03-09🔢 math

Mean-field games with unbounded controls: a weak formulation approach to global solutions

该论文通过建立二次增长广义 McKean-Vlasov 倒向随机微分方程的新存在性与稳定性结果，在无需模型参数或时间范围有界且允许控制变量二次型运行成本的条件下，证明了具有无界控制空间的非马尔可夫均值场博弈弱形式解的存在性。

Ulrich Horst, Takashi Sato2026-03-09🔢 math

A Lock-Free Work-Stealing Algorithm for Bulk Operations

本文提出了一种专为混合整数规划求解器中基于决策图的并行化框架设计的无锁工作窃取队列，该队列通过支持原生批量操作和简化并发模型（单所有者单窃取者），实现了恒定延迟的推送性能并显著优于现有通用方案。

Raja Sai Nandhan Yadav Kataru, Danial Davarnia, Ali Jannesari2026-03-09🔢 math

On Koopman Resolvents and Frequency Response of Nonlinear Systems

本文提出了一种基于 Koopman 算子框架的非线性系统频率响应新公式，通过输出拉普拉斯变换将经典 LTI 方法推广至非线性领域，并导出了用于绘制伯德图的复值响应函数及存在性充分条件。

Yoshihiko Susuki, Natsuki Katayama, Alexandre Mauroy, Igor Mezic2026-03-09🔢 math

Nonlinear Conjugate Gradient Method for Multiobjective Optimization Problems of Interval-Valued Maps

本文提出了一种利用满足 Wolfe 条件的步长搜索来求解无约束多目标区间优化问题 Pareto 临界点的非线性共轭梯度算法，并通过推导 Zoutendijk 条件证明了该算法在多种参数变体下的全局收敛性，同时通过数值实验验证了其性能。

Tapas Mondal, Debdas Ghosh, Jingxin Liu, Jie Li2026-03-09🔢 math

Bayesian Linear Programming under Learned Uncertainty: Posterior Feasibility Guarantees, Scenario Certification, and Applications

本文提出了一种将贝叶斯学习与线性规划相结合的框架，通过利用数据更新不确定性分布并构建后验可行性保障（包括可信域鲁棒化、后验场景法及蒙特卡洛认证），在提升决策安全性的同时实现了具有可解释性的不确定性感知优化。

Debashis Chatterjee2026-03-09🔢 math

Newton Method for Multiobjective Optimization Problems of Interval-Valued Maps

本文提出了一种基于牛顿法的算法，通过建立弱帕累托最优与帕累托临界点之间的联系，并结合 Armijo 型线搜索策略，有效求解了具有区间不确定性的多目标优化问题，并证明了其收敛性及在投资组合优化中的应用效果。

Tapas Mondal, Debdas Ghosh, Do Sang Kim2026-03-09🔢 math

A Hierarchical Bayesian Dynamic Game for Competitive Inventory and Pricing under Incomplete Information: Learning, Credible Risk, and Equilibrium

本文提出了一种结合贝叶斯学习与可信风险准则的层级贝叶斯动态博弈框架，用于解决竞争环境下信息不完全时的库存与定价决策问题，并通过仿真及生物数据实证验证了该模型在不确定性环境下的有效性与跨领域适用性。

Debashis Chatterjee2026-03-09🔢 math

Policy Iteration Achieves Regularized Equilibrium under Time Inconsistency

本文针对一般熵正则化时间不一致随机控制问题，设计了一种基于探索性平衡哈密顿 - 雅可比 - 贝尔曼方程的策略迭代算法，并证明了该算法生成的策略和值函数能以指数速率收敛至平衡策略，从而在构造性证明全局解存在唯一性的同时解决了策略改进失效及目标值函数先验未知的难题。

Yu-Jui Huang, Xiang Yu, Keyu Zhang2026-03-09🔢 math

General Bounds on Functionals of the Lifetime under Life Table Constraints

该论文针对生命表仅提供整数年龄生存概率而缺乏分数年龄死亡分布信息的问题，提出了两种互补的约束方法（即几乎必然一致与期望一致），推导了寿命泛函的上下界，从而为寿险公司在不依赖特定分数年龄假设的情况下量化死亡率偏差对合同价值的影响提供了鲁棒框架。

Jean-Loup Dupret, Edouard Motte2026-03-09🔢 math