stat.ML Arbeiten | Gist.Science

Invariance-Based Dynamic Regret Minimization

Die Arbeit stellt ISD-linUCB vor, einen Algorithmus für stochastische nicht-stationäre lineare Banditen, der durch die Annahme einer Zerlegung des Belohnungsmodells in stationäre und nicht-stationäre Komponenten historische Daten nutzt, um Invarianzen zu lernen und so die Problemdimensionalität zu reduzieren sowie das dynamische Regret in sich schnell verändernden Umgebungen signifikant zu verbessern.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Diese Arbeit stellt eine hierarchische Bayessche Methode vor, die adaptive Surrogatmodelle und maschinelles Lernen nutzt, um sowohl individuelle Systemparameter als auch gemeinsame unbekannte Dynamiken in inversen ODE- und PDE-Problemen effizient zu schätzen.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Die Autoren stellen für das Problem der Identifizierung des besten Arms in gruppierten Banditen unter festen Budgets eine neue untere Schranke für die Fehlerwahrscheinlichkeit vor und entwickeln den Algorithmus FCSR, der sowohl die Machbarkeitsbedingungen erfüllt als auch eine optimale Abhängigkeit von den Problemparametern erreicht.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Diese Arbeit stellt einen sparsen Subgradienten-Algorithmus vor, der die durch die Max-Plus-Algebra bedingte Sparsity in den Gradienten gezielt ausnutzt, um das Training von Max-Plus-Neuronalen Netzen effizienter zu gestalten.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

Stable and Steerable Sparse Autoencoders with Weight Regularization

Die Studie zeigt, dass die Einführung von L2-Gewichtsregularisierung in Sparse Autoencodern die Stabilität und Steuerbarkeit der gelernten Merkmale über verschiedene Trainingsläufe hinweg signifikant verbessert, ohne dabei die automatisierten Interpretierbarkeitswerte zu beeinträchtigen.

Piotr Jedryszek, Oliver M. Crook2026-03-05🤖 cs.LG

Beyond Mixtures and Products for Ensemble Aggregation: A Likelihood Perspective on Generalized Means

Diese Arbeit stellt eine likelihood-basierte Analyse der verallgemeinerten Mittelwerte zur Aggregation von Dichteschätzungen vor, die zeigt, dass nur der Bereich $r \in [0,1]$ systematische Verbesserungen gegenüber einzelnen Verteilungen garantiert und damit die theoretische Grundlage für die etablierten linearen und geometrischen Pooling-Methoden liefert.

Raphaël Razafindralambo, Rémy Sun, Frédéric Precioso + 2 more2026-03-05🤖 cs.LG

Semi-Supervised Generative Learning via Latent Space Distribution Matching

Die Arbeit stellt Latent Space Distribution Matching (LSDM) vor, ein neuartiges Framework für die semi-überwachte generative Modellierung, das durch die Kombination von gepaarten und ungepaarten Daten in einem latenten Raum die Verteilungsmatching-Fehlergrenzen minimiert, die geometrische Genauigkeit verbessert und theoretische Einblicke in die Konsistenz von Latent Diffusion Models liefert.

Kwong Yu Chong, Long Feng2026-03-05🤖 cs.LG

PTOPOFL: Privacy-Preserving Personalised Federated Learning via Persistent Homology

Die Arbeit stellt PTOPOFL vor, ein privatsphäreschonendes Framework für personalisiertes Federated Learning, das durch den Austausch topologischer Deskriptoren anstelle von Gradienten sowohl Daten-Rekonstruktionsangriffe verhindert als auch die Leistung bei nicht-IID-Datenverteilungen verbessert.

Kelly L Vomo-Donfack, Adryel Hoszu, Grégory Ginot + 1 more2026-03-05🤖 cs.LG

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Diese Arbeit entwickelt geometrische Designprinzipien für Quantenneuronale Netze, die mittels des Kriteriums der fast vollständigen lokalen Selektivität (aCLS) zeigen, dass effektives Feature-Learning trainierbare, datenabhängige geometrische Deformationen erfordert, und verlagert den Designfokus von der bloßen Zustandsreichweite auf die kontrollierbare Geometrie.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Denoising Diffusion Probabilistic Models

Diese Arbeit stellt hochwertige Bildsyntheseergebnisse mittels Diffusions-Wahrscheinlichkeitsmodellen vor, die durch eine neuartige Verbindung zu Denoising Score Matching und Langevin-Dynamik trainiert werden und auf CIFAR10 sowie LSUN neue State-of-the-Art-Ergebnisse erzielen.

Jonathan Ho, Ajay Jain, Pieter Abbeel2020-06-19🤖 cs.LG

Scaling Laws for Neural Language Models

Die Studie zeigt, dass die Leistung von Sprachmodellen durch einfache Potenzgesetze in Abhängigkeit von Modellgröße, Datensatzgröße und Rechenkapazität bestimmt wird, was zu der Empfehlung führt, sehr große Modelle auf moderaten Datenmengen zu trainieren und den Prozess vor der Konvergenz zu stoppen, um die Rechenressourcen optimal zu nutzen.

Jared Kaplan, Sam McCandlish, Tom Henighan + 7 more2020-01-23🤖 cs.LG

Generative Adversarial Networks

Die Autoren stellen ein neues Framework vor, das zwei Modelle – ein generatives Modell G und ein diskriminatives Modell D – in einem adversären Minimax-Spiel gleichzeitig trainiert, um die Datenverteilung zu erfassen, ohne dabei Markov-Ketten oder aufwendige Inferenznetzwerke zu benötigen.

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza + 5 more2014-06-10📊 stat.ML

Auto-Encoding Variational Bayes

Dieses Paper stellt einen skalierbaren stochastischen Variationsinferenz-Algorithmus vor, der durch eine Reparametrisierung des unteren Schranken-Schätzers effizientes Lernen und Inferenz in gerichteten probabilistischen Modellen mit kontinuierlichen latenten Variablen und großen Datensätzen ermöglicht.

Diederik P Kingma, Max Welling2013-12-20📊 stat.ML

← Zurück