stat.ML Arbeiten | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Diese Arbeit stellt die ReinMax-Rao- und ReinMax-CV-Schätzer vor, die Rao-Blackwellisierung und Kontrollvariablen nutzen, um die hohe Varianz des ReinMax-Algorithmus für diskrete latente Variablen zu reduzieren und so das Training von Variational Autoencodern zu verbessern.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Diese Arbeit leitet sublineare Bayes'sche Regret-Schranken für den GP-PSRL-Algorithmus in kontinuierlichen Steuerungsproblemen mit unbeschränkten Zustandsräumen her, indem sie durch eine rekursive Anwendung der Borell-Tsirelson-Ibragimov-Sudakov-Ungleichung und die Kettenmethode die Beschränktheit der besuchten Zustände nachweist und eine enge Abhängigkeit vom maximalen Informationsgewinn erreicht.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Die vorgestellte Arbeit entwickelt eine neue Methode zur Generierung plausibler Gegenbeispiel-Erklärungen für Zeitreihenklassifikation, die durch gradientenbasierte Optimierung und eine soft-DTW-basierte Plausibilitätskomponente realistischere zeitliche Strukturen erzeugt als bestehende Ansätze.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Diese Arbeit vereint Online- und Off-Policy-Varianzreduktionsmethoden, indem sie die mathematische Äquivalenz zwischen dem Difference-in-Means-Schätzer und einem optimierten Inverse Propensity Scoring-Schätzer sowie zwischen Regressionsanpassungsverfahren und Doubly Robust-Schätzung nachweist.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Diese Arbeit stellt einen neuartigen Optimierungsalgorithmus auf Basis der fraktionalen Kalkültheorie vor, der durch den Einsatz des Weighted Fractional Weyl Integrals als dynamischen Gedächtnisoperator die Nachteile lokaler Gradientenverfahren überwindet und in stark unausgewogenen Datensätzen wie denen der Finanzbetrugserkennung signifikant robustere Ergebnisse erzielt.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Die vorgestellte Arbeit stellt eine effiziente Methode zur Erzeugung von Glaubensmengen (Credal Sets) durch Decalibration vor, die es ermöglicht, epistemische Unsicherheit auch bei komplexen Modellen wie TabPFN und CLIP ohne den hohen Rechenaufwand eines Ensembles zu quantifizieren.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Diese Arbeit überwindet die durch die Verzerrung von Schätzern bei nichtlinearen Nutzenfunktionen verursachte Ineffizienz im multi-objektiven Reinforcement Learning, indem sie einen Natural Policy Gradient-Algorithmus mit einem Multi-Level-Monte-Carlo-Schätzer entwickelt, der die optimale Stichprobenkomplexität von $\widetilde{\mathcal{O}}(\epsilon^{-2})$ erreicht.

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Der Artikel stellt Generative Adversarial Regression (GAR) vor, ein Framework, das durch eine Minimax-Formulierung und die Ausrichtung auf nachgelagerte Risikofunktionale wie VaR und ES realistische, bedingte Risikoszenarien generiert, die unter adversarisch ausgewählten Politiken robuster und genauer sind als herkömmliche Baselines.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Diese Arbeit leitet eine obere Schranke für den Approximationsfehler linearer Wertfunktionsapproximationen in der Verstärkungslernung her, die zeigt, wie sich die Qualität der Laplace-basierten Zustandsrepräsentation mit der algebraischen Konnektivität des Übergangsgraphen skaliert, und liefert dabei eine vollständige Fehlerzerlegung für den gesamten Lernprozess ohne Annahmen zur Symmetrie der Übergangskernel.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Dieses Paper stellt Momentum SVGD-EM vor, eine beschleunigte Variante des EM-Algorithmus für die maximale marginale Likelihood-Schätzung, die durch die Einführung von Nesterov-Acceleration sowohl in den Parameter-Updates als auch im Raum der Wahrscheinlichkeitsmaße eine schnellere Konvergenz in verschiedenen Szenarien erreicht.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

Die Arbeit stellt strukturelle kausale Flaschenhals-Modelle (SCBMs) vor, die kausale Effekte zwischen hochdimensionalen Variablen auf niedrigdimensionale Zusammenfassungen zurückführen, um eine flexible, identifizierbare und schätzbare Dimensionreduktion für Aufgaben wie Transferlernen zu ermöglichen.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Dieses Paper stellt eine neue Methode vor, die Low-Rank-Matrix-Vervollständigung durch eine disjunktive Branch-and-Bound-Strategie und neuartige konvexe Relaxierungen löst, um für Probleme bis zu 2500 Dimensionen und Rang 5 zertifizierbare Optimalität zu erreichen und dabei die Testfehler im Vergleich zu etablierten Heuristiken signifikant zu senken.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Der Artikel stellt ein effizientes, auf Optimaler Transport basierendes Aggregationsverfahren für verteilte Mixture-of-Experts-Modelle vor, das durch Minimierung einer Transportdivergenz eine globale Schätzung mit nur einem Kommunikationsschritt ermöglicht und dabei statistische Konsistenz sowie eine dem zentralen Training vergleichbare Leistung bei deutlich reduzierter Rechenzeit garantiert.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Dieser Artikel stellt zwei robuste Kriterien und einen darauf basierenden Differenz-der-Konvex-Algorithmus vor, um optimale Behandlungsregeln für zensierte Überlebensdaten zu ermitteln, die entweder die abgeschnittene mittlere Überlebenszeit oder gepufferte Überlebenswahrscheinlichkeiten maximieren.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Diese Arbeit formuliert kontinuierliche Optimal-Stopp-Probleme aus Reinforcement-Learning-Perspektive als regularisierte singuläre stochastische Steuerung mit endlichem Brennstoff, leitet daraus eine eindeutige optimale explorative Strategie her und entwickelt sowohl modellbasierte als auch skalierbare modellfreie Actor-Critic-Algorithmen zur Lösung dieser Probleme.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Die Studie stellt mit EarthquakeNPP ein neues Benchmark-System für die Erdbebenprognose vor, das aufbereiteten Daten und etablierte seismologische Modelle wie ETAS nutzt, und zeigt, dass die getesteten neuronalen Punktprozesse (NPPs) die Leistung des klassischen ETAS-Modells in aktuellen Anwendungen noch nicht übertreffen.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

Die Studie zeigt, dass Diffusionsmodelle bei knappen Daten nicht abrupt, sondern durch einen allmählichen geometrischen Zusammenbruch ihrer latenten Dimensionalität memorieren, bei dem zunächst markante Merkmale und dann feinere Details eingefroren werden, was zu einer Phase zwischen Generalisierung und exakter Kopie führt.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

Die Arbeit stellt CLIQUE vor, eine neue modellunabhängige Methode zur Berechnung der lokalen Variablenwichtigkeit, die im Gegensatz zu etablierten Verfahren wie LIME und SHAP lokale Abhängigkeiten und Interaktionen erfasst, insbesondere bei Mehrklassen-Klassifikationsproblemen, und Verzerrungen in Bereichen reduziert, in denen Variablen keinen Einfluss auf die Antwort haben.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Diese Arbeit stellt ein neues statistisches Modell für Paarvergleiche vor, das auf einer schief-symmetrischen Matrix basiert und die einschränkende Annahme der stochastischen Transitivität aufgibt, um in realen Szenarien mit komplexen Fähigkeiten oder Strategien eine überlegene Vorhersagegenauigkeit und theoretische Optimalität zu erreichen.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Die Studie stellt einen Algorithmus vor, der die Support-Vector-Classification in nicht-euklidischen Räumen durch die Integration der Datenkovarianz mittels Cholesky-Zerlegung in das Optimierungsproblem verbessert und damit die Suboptimalität herkömmlicher KKT-Bedingungen sowie eine signifikant höhere Klassifikationsleistung im Vergleich zu traditionellen SVM-Ansätzen nachweist.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Zurück Weiter →