A Globally Convergent Third-Order Newton Method via Unified Semidefinite Programming Subproblems

Die Arbeit stellt die Adaptive Levenberg-Marquardt Third-Order Newton Method (ALMTON) vor, ein neuartiges Optimierungsverfahren für nichtkonvexe Probleme, das durch die Lösung einheitlicher semidefiniter Programmier-Teilprobleme eine global konvergente, unregulierte dritte-Ordnung-Newton-Methode ermöglicht und dabei eine bessere Konvergenz als bestehende Ansätze bei vorhersagbaren Iterationskosten bietet.

Yubo Cai, Wenqi Zhu, Coralia Cartis, Gioele ZardiniWed, 11 Ma🔢 math

Optimal Control in Age-Structured Populations: A Comparison of Rate-Control and Effort-Control

Diese Arbeit vergleicht die mathematischen und bioökonomischen Unterschiede zwischen der direkten Entnahmerate (Rate-Control) und der aggregatabhängigen Anstrengung (Effort-Control) bei der optimalen Ernte alterstrukturierter Populationen, indem sie notwendige Optimalitätsbedingungen für beide Modelle herleitet und zeigt, wie die Anstrengungsführung durch einen nichtlokalen Kopplungsterm im adjungierten System strukturell verändert wird.

Jiguang Yu, Louis Shuo WangWed, 11 Ma🔢 math

Bilevel Optimization and Heuristic Algorithms for Integrating Latent Demand into the Design of Large-Scale Transit Systems

Diese Arbeit stellt ein generisches bilevel-Optimierungsmodell (TN-DA) vor, das latente Nachfrage in die Gestaltung von großflächigen Transitsystemen integriert, und entwickelt effiziente heuristische Algorithmen, die auf realen Datensätzen nachweisen, dass sich hochwertige Lösungen unter Berücksichtigung von Nutzeradoption schneller als mit exakten Methoden finden lassen.

Hongzhao Guan, Beste Basciftci, Pascal Van HentenryckTue, 10 Ma🔢 math

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Dieser Beitrag stellt eine kostengesteuerte Methode zur Erlernung von Zustandsrepräsentationen für die lineare quadratische Gaußsche (LQG) Steuerung vor und liefert erstmals endliche Stichproben-Garantien für die Konvergenz zu einem nahezu optimalen Regler, indem ein latentes Modell ausschließlich durch die Vorhersage von Kosten statt von Beobachtungen gelernt wird.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Erratum and original of Port-Hamiltonian structure of interacting particle systems and its mean-field limit

Dieses Papier korrigiert einen Fehler in einer früheren Arbeit zur port-Hamiltonian-Struktur von wechselwirkenden Teilchensystemen, indem es die Gültigkeit der Konvergenz des Hamilton-Gradienten bestätigt, die relative Kompaktheit der Trajektorien ohne zusätzliche Attraktivitätsannahme widerlegt und gleichzeitig die Erhaltung dieser Struktur im Mean-Field-Limit sowie neue Stabilitätsaussagen für das System liefert.

Jannik Daun, Daniel Jannik Happ, Birgit Jacob, Claudia TotzeckTue, 10 Ma🔢 math

Distributional stability of sparse inverse covariance matrix estimators

Diese Arbeit untersucht die Verteilungsstabilität eines sparse Schätzers für die Inverse Kovarianzmatrix unter kontaminierten Daten, indem sie explizite lokale Lipschitz-Schranken für die Distanz zwischen den Verteilungen des Schätzers mittels der Kantorovich-Metrik herleitet und diese Ergebnisse auf Standard-Kovarianzschätzer sowie numerische Experimente und Anwendungen überträgt.

Renjie Chen, Huifu Xu, Henryk ZähleTue, 10 Ma🔢 math

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Diese Arbeit zeigt, dass Policy-Gradient-Methoden für eine Klasse von endlich-horizontigen MDPs mit allgemeinen Zustands- und Aktionsräumen trotz Nichtkonvexität durch die Etablierung einer Polyak-Łojasiewicz-Kurdyka-Bedingung global konvergieren und dabei erstmals sample-complexity-Garantien für stochastische Lagerhaltungs- und Kassenhaltungsprobleme liefern.

Xin Chen, Yifan Hu, Minda ZhaoTue, 10 Ma🤖 cs.LG

Robustness to Model Approximation, Model Learning From Data, and Sample Complexity in Wasserstein Regular MDPs

Die Arbeit untersucht die Robustheit diskreter stochastischer optimaler Steuerungen gegenüber Wasserstein-Modellapproximationen, indem sie die Performanceverluste bei der Anwendung optimaler Strategien auf approximative Modelle quantifiziert und dabei insbesondere Anwendungen im empirischen Modelllernen sowie Schranken für die Stichprobenkomplexität behandelt.

Yichen Zhou, Yanglei Song, Serdar YükselTue, 10 Ma🔢 math

Minimax Linear Regulator Problems for Positive Systems

Diese Arbeit stellt explizite Lösungen für ein Minimax-Linearregler-Problem bei positiven linearen zeitinvarianten Systemen mit mehreren Störungen vor, indem sie dynamische Programmierung für endliche und unendliche Zeithorizonte nutzt und ein Fixpunktverfahren zur Berechnung des unendlichen Horizonts sowie die Untersuchung des minimalen L1-induzierten Gewinns anwendet.

Alba Gurpegui, Mark Jeeninga, Emma Tegling, Anders RantzerTue, 10 Ma🔢 math