stat.ML papers | Gist.Science

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Deze paper introduceert de ReinMax-Rao en ReinMax-CV schatters, die Rao-Blackwellisatie en controlevariatietechnieken toepassen op de ReinMax-methode om de hoge variantie bij het trainen van modellen met discrete latente variabelen te verminderen en zo de prestaties te verbeteren.

Daniel Wang, Thang D. BuiTue, 10 Ma🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Dit artikel presenteert een sublineaire Bayesiaanse regret-begrenzing voor het GP-PSRL-algoritme in continue besturingsproblemen met onbegrensde toestanden, waarbij wordt aangetoond dat bezochte toestanden met hoge waarschijnlijkheid binnen een bijna constante straal blijven en een strakke afhankelijkheid van de maximale informatiewinst wordt bereikt.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan PetersTue, 10 Ma🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}baTue, 10 Ma🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Dit artikel overbrugt de kloof tussen online en off-policy experimenten door wiskundig te bewijzen dat hun veelgebruikte variantiereductiemethoden, zoals Difference-in-Means en regressie-aanpassing, structureel equivalent zijn aan respectievelijk optimale inverse propensity scoring en doubly robust schatting.

Olivier JeunenTue, 10 Ma🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Deze paper introduceert een nieuwe optimalisatiealgoritme gebaseerd op fractionele Weyl-integrals die het Markov-aanneming doorbreekt door het gebruik van een dynamisch gewogen historische geheugenoperator, wat leidt tot aanzienlijk betere prestaties bij het hanteren van onevenwichtige datasets zoals fraudeopsporing en medische diagnostiek.

Gustavo A. DorregoTue, 10 Ma🤖 cs.LG

Efficient Credal Prediction through Decalibration

Deze paper introduceert een efficiënte methode genaamd 'decalibration' om credale voorspellingen te genereren voor complexe modellen zoals foundation models, waardoor onzekerheid op een rekenkundig haalbare manier kan worden weergegeven zonder het noodzakelijke hertrainen van modelensembles.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke HüllermeierTue, 10 Ma🤖 cs.LG

Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning

Deze paper introduceert een Natural Policy Gradient-algoritme met een multi-level Monte Carlo-schatter dat de inherente bias in concave multi-objective reinforcement learning overwint en zo de optimale $\widetilde{\mathcal{O}}(\epsilon^{-2})$ steekproefcomplexiteit bereikt.

Swetha Ganesh, Vaneet AggarwalTue, 10 Ma🤖 cs.LG

Generative Adversarial Regression (GAR): Learning Conditional Risk Scenarios

Dit artikel introduceert Generative Adversarial Regression (GAR), een raamwerk dat conditionele risicoscenario's leert door generatoren te trainen die via een minimax-formulering de risicoprofielen van werkelijke data onder diverse beleidsstrategieën nabootsen, wat resulteert in robuustere en meer accurate risico-inschattingen dan bestaande methoden.

Saeed Asadi, Jonathan Yu-Meng LiTue, 10 Ma🤖 cs.LG

Impact of Connectivity on Laplacian Representations in Reinforcement Learning

Deze paper toont aan dat de kwaliteit van compacte toestandsrepresentaties in versterkend leren, die zijn gebaseerd op Laplaciaan-eigenvectoren, direct wordt beïnvloed door de algebraïsche connectiviteit van de overgangsgrafiek, en levert een volledige foutanalyse voor zowel de benadering als de schatting van deze eigenschappen.

Tommaso Giorgi, Pierriccardo Olivieri, Keyue Jiang, Laura Toni, Matteo PapiniTue, 10 Ma🤖 cs.LG

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Deze paper introduceert Momentum SVGD-EM, een versnelde variant van het Expectation-Maximisation-algoritme voor maximum marginale likelihood-schatting die Nesterov-versnelling toepast op zowel de parameterupdates als de ruimte van waarschijnlijkheidsmaatregelen om de convergentie in diverse taken te verbeteren.

Adam Rozzio, Rafael Athanasiades, O. Deniz AkyildizTue, 10 Ma🤖 cs.LG

Structural Causal Bottleneck Models

Dit paper introduceert structurele causale knelpuntmodellen (SCBMs), een nieuw kader dat causale effecten tussen hoogdimensionale variabelen reduceert tot laagdimensionale samenvattingen om schattingen te vereenvoudigen en prestaties in transferlearning te verbeteren.

Simon Bing, Jonas Wahl, Jakob RungeTue, 10 Ma🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Dit artikel introduceert een disjunctieve branch-and-bound-methode en nieuwe convex relaxaties die lage-rang-matrixcompletieproblemen met een gegarandeerd optimaal resultaat oplossen, wat leidt tot aanzienlijk lagere trainings- en testfouten vergeleken met bestaande heuristieken.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean PauphiletThu, 12 Ma📊 stat

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Deze paper introduceert een efficiënt, op optimale transport gebaseerd aggregatiekader voor het combineren van lokaal getrainde Mixture-of-Experts-modellen in een decentrale omgeving, waarbij met slechts één communicatiestap een globaal model wordt verkregen dat prestaties vergelijkbaar met centrale training bereikt.

Faïcel Chamroukhi, Nhat Thien PhamThu, 12 Ma📊 stat

Learning Robust Treatment Rules for Censored Data

Dit artikel introduceert twee robuuste criteria en een sampling-based difference-of-convex algoritme voor het leren van optimale behandelingsregels bij gecensureerde overlevingsdata, met als doel de afgeknotte gemiddelde overlevingstijd en bufferde overlevingskansen te maximaliseren.

Yifan Cui, Junyi Liu, Tao Shen, Zhengling Qi, Xi ChenThu, 12 Ma📊 stat

Exploratory Optimal Stopping: A Singular Control Formulation

Dit artikel introduceert een geregeliseerd optimalisatieprobleem voor het stoppen van processen, geformuleerd als een singuliere stochastische controle met een entropiestrafsysteem om exploratie te bevorderen, en biedt zowel model-gebaseerde als model-vrije versterkende leeralgoritmen met gegarandeerde verbetering.

Jodi Dianetti, Giorgio Ferrari, Renyuan XuThu, 12 Ma💰 q-fin

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Dit paper introduceert EarthquakeNPP, een verbeterde benchmark voor aardbevingvoorspelling die aantoont dat de geteste neurale puntprocessen (NPPs) momenteel niet beter presteren dan de klassieke ETAS-modellen.

Samuel Stockman, Daniel Lawson, Maximilian WernerThu, 12 Ma🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

Dit artikel introduceert een geometrisch theorie voor generatieve diffusiemodellen, waarin wordt aangetoond dat memorisatie van trainingsdata niet abrupt maar geleidelijk verloopt via een 'gladde instorting' waarbij het model zich geleidelijk concentreert op een paar voorbeelden naarmate de data schaars wordt.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca AmbrogioniThu, 12 Ma📊 stat

Conditional Local Importance by Quantile Expectations

Dit paper introduceert CLIQUE, een model-onafhankelijke methode voor lokale variabele belangrijkheid die beter in staat is om lokale afhankelijkheden en interacties in multiclass-classificatieproblemen vast te leggen dan bestaande technieken zoals LIME en SHAP.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. MoonThu, 12 Ma📊 stat

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Dit artikel introduceert een nieuw statistisch model voor paarwijze vergelijkingen dat de beperkende aanname van stochastische transitiviteit elimineert door gebruik te maken van een laag-dimensionale schuine-symmetrische matrix, waardoor het superieure voorspellende prestaties biedt in complexe scenario's waar traditionele modellen zoals Bradley-Terry falen.

Sze Ming Lee, Yunxiao ChenThu, 12 Ma📊 stat

An Algorithm to perform Covariance-Adjusted Support Vector Classification in Non-Euclidean Spaces

Dit artikel introduceert een Cholesky-SVM-algoritme dat de beperkingen van traditionele SVM's in niet-Euclidische ruimtes overbrugt door de covariantie van de data in de optimalisatie te integreren, wat leidt tot aanzienlijk betere classificatieprestaties dan bestaande methoden.

Satyajeet Sahoo, Jhareswar MaitiThu, 12 Ma📊 stat

← Vorige Volgende →