On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Diese Arbeit entwickelt eine neue Stabilitätsanalyse für multipass Preconditioned SGD, die zeigt, wie die Wechselwirkung zwischen der Krümmung des Populationsrisikos und der Gradientenrauschen-Geometrie die Generalisierungsfähigkeit über die effektive Dimension bestimmt, und liefert dazu sowohl obere Schranken als auch passende untere Schranken.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Die Arbeit stellt BTZSC vor, ein umfassendes Benchmark für das Zero-Shot-Textklassifizieren, das zeigt, dass moderne Reranker wie Qwen3-Reranker-8B den aktuellen State-of-the-Art erreichen, während starke Embedding-Modelle und Instruktion-tuned LLMs ebenfalls wettbewerbsfähige Ergebnisse liefern und die Grenzen früherer NLI-basierter Ansätze überwinden.

Ilias AarabFri, 13 Ma💬 cs.CL

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Diese Arbeit stellt einen neuen Ansatz für das Batch-Bayes'sche Optimal-Experiment-Design vor, der das Optimierungsproblem durch eine probabilistische Hebung in den Raum der Wahrscheinlichkeitsmaße transformiert und unter Verwendung von Wasserstein-Gradientenflüssen skalierbare, partikelbasierte Algorithmen entwickelt, um hochdimensionale und nicht-konvexe Nutzenfunktionen effizient zu optimieren.

Louis SharrockFri, 13 Ma📊 stat

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Die Studie unterscheidet zwischen geopolitischen Schocks, die das Ausfallrisiko von Staaten direkt beeinflussen, und geoekonomischen Schocks, die über die erwartete Geldpolitik wirken, und zeigt anhand eines Datensatzes von 42 Volkswirtschaften, dass diese unterschiedlichen Kanäle zu einem charakteristischen „Scherenmuster" in den Sovereign-CDS-Spreads führen, was darauf hindeutet, dass Liquiditätsbereitstellung zwar finanzzyklusbedingte Spread-Erweiterungen mildern, aber nicht die persistierenden geopolitischen Risikoprämien adressieren kann.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Diese Studie stellt einen banditbasierten Ansatz vor, der mithilfe von Contextual Thompson Sampling personalisierte Übungsfolgen für Lernende generiert, um den Kompetenzzuwachs in digitalen Lernumgebungen zu optimieren und gleichzeitig skalierbare individuelle Förderung sowie gezielte Unterstützungsmaßnahmen für Lehrende zu ermöglichen.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Die Autoren stellen eine Erweiterung semi-parametrischer Modelle auf Basis von Bayesian Additive Regression Trees (BART) vor, die durch modifizierte Baumgenerierungsverfahren die gemeinsame Nutzung von Kovariaten in linearen und nicht-parametrischen Komponenten ermöglicht, um Verzerrungen zu vermeiden und komplexe Interaktionen bei der Analyse von Bildungsdaten zu erfassen.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

Diese Arbeit stellt eine allgemeine Konvergenz- und Komplexitätsanalyse für blockweise Majorization-Minimization-Algorithmen bei nichtkonvexen Optimierungsproblemen mit Riemannschen Nebenbedingungen vor, die eine asymptotische Konvergenz zu stationären Punkten und eine O~(ϵ2)\widetilde{O}(\epsilon^{-2})-Iterationsschranke für ϵ\epsilon-stationäre Punkte garantiert und dabei eine breite Palette von Anwendungen wie robustes PCA und Riemannisches CP-Wörterbuch-Lernen abdeckt.

Yuchen Li, Laura Balzano, Deanna Needell + 1 more2026-03-10📊 stat

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Diese Arbeit stellt zwei einstufige Nullter-Ordnung-Primal-Dual-Algorithmen vor, die erstmals iterative Komplexitätsgarantien für nichtkonvexe-(stark) konkave Minimax-Probleme mit gekoppelten linearen Nebenbedingungen unter deterministischen und stochastischen Bedingungen bieten und dabei den aktuellen Stand der Technik übertreffen.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Towards a Fairer Non-negative Matrix Factorization

Diese Arbeit stellt eine faire Variante der nicht-negativen Matrixfaktorisierung (NMF) vor, die durch eine Min-Max-Formulierung des Zielfunktions-Optimierungsproblems die Fairness für Bevölkerungsgruppen verbessert, wobei die Autoren auf die Notwendigkeit hinweisen, dass dies zu Lasten der Genauigkeit für einzelne Individuen gehen kann und die Methode stark anwendungsspezifisch gewählt werden muss.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Diese Arbeit erweitert die Anwendbarkeit von Entropiefluss-Methoden zur Herleitung von Generalisierungsschranken auf alle lernenden Algorithmen, deren iterative Dynamik durch einen zeit-homogenen Markov-Prozess beschrieben wird, indem sie eine exakte Entropiefluss-Formel und Verbindungen zu modifizierten logarithmischen Sobolev-Ungleichungen einführt.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Die Autoren stellen Clip21-SGD2M vor, einen neuen Algorithmus für das Federated Learning, der durch eine innovative Kombination aus Clipping, Heavy-Ball-Momentum und Error Feedback sowohl optimale Konvergenzraten bei beliebiger Datenheterogenität als auch starke lokale Differentialprivatsphäre-Garantien ohne restriktive Annahmen erreicht.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math