stat.ML Arbeiten | Gist.Science

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Diese Arbeit entwickelt eine neue Stabilitätsanalyse für multipass Preconditioned SGD, die zeigt, wie die Wechselwirkung zwischen der Krümmung des Populationsrisikos und der Gradientenrauschen-Geometrie die Generalisierungsfähigkeit über die effektive Dimension bestimmt, und liefert dazu sowohl obere Schranken als auch passende untere Schranken.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

BTZSC: A Benchmark for Zero-Shot Text Classification Across Cross-Encoders, Embedding Models, Rerankers and LLMs

Die Arbeit stellt BTZSC vor, ein umfassendes Benchmark für das Zero-Shot-Textklassifizieren, das zeigt, dass moderne Reranker wie Qwen3-Reranker-8B den aktuellen State-of-the-Art erreichen, während starke Embedding-Modelle und Instruktion-tuned LLMs ebenfalls wettbewerbsfähige Ergebnisse liefern und die Grenzen früherer NLI-basierter Ansätze überwinden.

Ilias AarabFri, 13 Ma💬 cs.CL

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Die Arbeit beweist mathematisch und durch numerische Experimente, dass chemische Reaktionsnetzwerke ohne versteckte Schichten bestimmte Klassifizierungsaufgaben effizienter und genauer lösen können als Spiking-Neuronale-Netzwerke, die dafür versteckte Schichten benötigen.

Sophie Jaffard, Ivo F. SbalzariniFri, 13 Ma📊 stat

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Diese Arbeit stellt einen neuen Ansatz für das Batch-Bayes'sche Optimal-Experiment-Design vor, der das Optimierungsproblem durch eine probabilistische Hebung in den Raum der Wahrscheinlichkeitsmaße transformiert und unter Verwendung von Wasserstein-Gradientenflüssen skalierbare, partikelbasierte Algorithmen entwickelt, um hochdimensionale und nicht-konvexe Nutzenfunktionen effizient zu optimieren.

Louis SharrockFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

Diese Arbeit liefert eine quantitative Charakterisierung des Vergessens beim Nachtrainieren generativer Modelle, indem sie zeigt, wie die Wahl der Divergenzrichtung (Forward- vs. Reverse-KL), die geometrische Überlappung der Aufgaben und das Sampling-Verfahren das Ausmaß von Massenverlust und Komponentenverschiebung bestimmen.

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat

Riemannian Laplace Approximation with the Fisher Metric

Dieses Paper korrigiert die Verzerrungen und die zu starke Schmalheit der bisherigen Riemannschen Laplace-Approximation mit der Fisher-Metrik durch die Entwicklung zweier neuer Varianten, die im Grenzwert unendlicher Daten exakt sind und praktische Verbesserungen bieten.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Diese Arbeit stellt einen optimistischen Algorithmus für online kontextuelle Banditen mit KL-Regularisierung vor, der durch die Ausnutzung einer günstigen Optimierungslandschaft logarithmische Regret-Schranken erreicht, und erweitert diese Analyse auf das allgemeine Reinforcement-Learning-Setting.

Heyang Zhao, Chenlu Ye, Wei Xiong + 2 more2026-03-12📊 stat

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Die Studie unterscheidet zwischen geopolitischen Schocks, die das Ausfallrisiko von Staaten direkt beeinflussen, und geoekonomischen Schocks, die über die erwartete Geldpolitik wirken, und zeigt anhand eines Datensatzes von 42 Volkswirtschaften, dass diese unterschiedlichen Kanäle zu einem charakteristischen „Scherenmuster" in den Sovereign-CDS-Spreads führen, was darauf hindeutet, dass Liquiditätsbereitstellung zwar finanzzyklusbedingte Spread-Erweiterungen mildern, aber nicht die persistierenden geopolitischen Risikoprämien adressieren kann.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

A Bandit-Based Approach to Educational Recommender Systems: Contextual Thompson Sampling for Learner Skill Gain Optimization

Diese Studie stellt einen banditbasierten Ansatz vor, der mithilfe von Contextual Thompson Sampling personalisierte Übungsfolgen für Lernende generiert, um den Kompetenzzuwachs in digitalen Lernumgebungen zu optimieren und gleichzeitig skalierbare individuelle Förderung sowie gezielte Unterstützungsmaßnahmen für Lehrende zu ermöglichen.

Lukas De Kerpel, Arthur Thuy, Dries F. Benoit2026-03-12📊 stat

SSRCA: a novel machine learning pipeline to perform sensitivity analysis for agent-based models

Die Studie stellt SSRCA vor, eine neuartige maschinelle Lern-Pipeline, die die Sensitivitätsanalyse für komplexe agentenbasierte Modelle in der Biologie vereinfacht, indem sie empfindliche Parameter identifiziert, gemeinsame Ausgabemuster aufdeckt und robuste Ergebnisse im Vergleich zur Sobol'-Methode liefert.

Edward H. Rohr, John T. Nardini2026-03-11🧬 q-bio

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

Die Autoren stellen eine Erweiterung semi-parametrischer Modelle auf Basis von Bayesian Additive Regression Trees (BART) vor, die durch modifizierte Baumgenerierungsverfahren die gemeinsame Nutzung von Kovariaten in linearen und nicht-parametrischen Komponenten ermöglicht, um Verzerrungen zu vermeiden und komplexe Interaktionen bei der Analyse von Bildungsdaten zu erfassen.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

Convergence and complexity of block majorization-minimization for constrained block-Riemannian optimization

Diese Arbeit stellt eine allgemeine Konvergenz- und Komplexitätsanalyse für blockweise Majorization-Minimization-Algorithmen bei nichtkonvexen Optimierungsproblemen mit Riemannschen Nebenbedingungen vor, die eine asymptotische Konvergenz zu stationären Punkten und eine $\widetilde{O}(\epsilon^{-2})$ -Iterationsschranke für $\epsilon$ -stationäre Punkte garantiert und dabei eine breite Palette von Anwendungen wie robustes PCA und Riemannisches CP-Wörterbuch-Lernen abdeckt.

Yuchen Li, Laura Balzano, Deanna Needell + 1 more2026-03-10📊 stat

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Diese Arbeit stellt zwei einstufige Nullter-Ordnung-Primal-Dual-Algorithmen vor, die erstmals iterative Komplexitätsgarantien für nichtkonvexe-(stark) konkave Minimax-Probleme mit gekoppelten linearen Nebenbedingungen unter deterministischen und stochastischen Bedingungen bieten und dabei den aktuellen Stand der Technik übertreffen.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Towards a Fairer Non-negative Matrix Factorization

Diese Arbeit stellt eine faire Variante der nicht-negativen Matrixfaktorisierung (NMF) vor, die durch eine Min-Max-Formulierung des Zielfunktions-Optimierungsproblems die Fairness für Bevölkerungsgruppen verbessert, wobei die Autoren auf die Notwendigkeit hinweisen, dass dies zu Lasten der Genauigkeit für einzelne Individuen gehen kann und die Methode stark anwendungsspezifisch gewählt werden muss.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Diese Studie präsentiert eine umfassende experimentelle Untersuchung fairer maschineller Lernverfahren im Kredit-Scoring, die zeigt, dass diese Modelle im Vergleich zu traditionellen Klassifikationsmodellen eine bessere Balance zwischen Vorhersagegenauigkeit und Fairness erreichen.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Diese Arbeit zeigt, dass der Fluch der Dimensionalität die Optimierung neuronaler Netze mit glatten Aktivierungsfunktionen fundamental einschränkt, indem sie nachweist, dass die Konvergenzrate des Populationsrisikos unter Gradientenfluss durch die Dimension des Eingaberaums und die Glattheit der Zielfunktion begrenzt wird.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Diese Arbeit erweitert die Anwendbarkeit von Entropiefluss-Methoden zur Herleitung von Generalisierungsschranken auf alle lernenden Algorithmen, deren iterative Dynamik durch einen zeit-homogenen Markov-Prozess beschrieben wird, indem sie eine exakte Entropiefluss-Formel und Verbindungen zu modifizierten logarithmischen Sobolev-Ungleichungen einführt.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

Die Autoren stellen Clip21-SGD2M vor, einen neuen Algorithmus für das Federated Learning, der durch eine innovative Kombination aus Clipping, Heavy-Ball-Momentum und Error Feedback sowohl optimale Konvergenzraten bei beliebiger Datenheterogenität als auch starke lokale Differentialprivatsphäre-Garantien ohne restriktive Annahmen erreicht.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

Variational Formulation of Particle Flow

Diese Arbeit stellt die Log-Homotopie-Teilchenströmung als zeitlich skalierten Fisher-Rao-Gradientenfluss im Rahmen der variationellen Inferenz dar, leitet daraus eine Gaußsche Approximation ab, die unter linearen Gaußschen Annahmen auf die exakte Daum-Huang-Strömung reduziert wird, und erweitert den Ansatz durch Gaußsche Mischungen für multimodale Verteilungen.

Yinzhuang Yi, Jorge Cortés, Nikolay Atanasov2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Die Studie stellt mit „CausalPitfalls" ein umfassendes Benchmark vor, das die Fähigkeit von Large Language Models zur zuverlässigen kausalen Inferenz unter Berücksichtigung statistischer Fallstricke wie Simpson-Paradoxon und Selektionsverzerrung rigoros evaluiert und dabei erhebliche Defizite aktueller Modelle aufzeigt.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

← Zurück Weiter →