stat.ML papers | Gist.Science

Towards Reliable Simulation-based Inference

Deze thesis onderzoekt hoe machine learning-benaderingen voor simulatiegebaseerde inferentie vaak tot oververzekerde conclusies leiden en stelt methoden voor, zoals 'balancing' en Bayesiaanse neurale netwerken, om deze oververzekerde schattingen te corrigeren en meer betrouwbare, gekalibreerde resultaten te garanderen.

Arnaud DelaunoyWed, 11 Ma🤖 cs.LG

Estimation of heterogeneous principal effects under principal ignorability

Dit artikel presenteert een raamwerk voor het schatten en afleiden van heterogene hoofdeffecten onder de aanname van principal ignorability, waarbij verschillende schatters worden ontwikkeld met uiteenlopende robuustheidseigenschappen en geïllustreerd aan de hand van de Camden Coalition-hotspotting-randomeerde trial.

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Dit artikel presenteert een axioma-benadering voor datagedreven robuuste Markov-beslissingsprocessen op Borel-ruimten, waarbij wordt aangetoond dat empirische verdelingen gecombineerd met een afstandsfunctie leiden tot sterke prestatiegaranties en convergentiebewijzen die ontbreken bij traditionele empirische MDP's.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Dit boek herinterpreteert generatieve AI, met name flow matching, als een statistisch raamwerk voor het niet-parametrisch leren van hoogdimensionale verdelingen, waardoor methoden zoals imputatie en causale inferentie worden onderbouwd door orthogonalisatie en cross-fitting.

Shinto EguchiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Dit artikel verifieert dat persistente waarnemers in hypergraafsubstraten voldoen aan de Conant-Ashby Good Regulator-theorema, waardoor natuurlijke gradiëntafstijging als unieke leerregel wordt afgeleid en een verband wordt gelegd tussen Wolfram's hypergrafen en Vanchurin's kosmologie via een modelafhankelijke afleiding van de regimeparameter alpha.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Better Bounds for the Distributed Experts Problem

Dit artikel presenteert een verbeterd protocol voor het gedistribueerde experts-probleem dat de spijt minimaliseert met een efficiëntere communicatiekost dan eerdere werken.

David P. Woodruff, Samson ZhouWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Deze paper introduceert een uniek generatief steekproefkader dat, door het minimaliseren van de Maximum Mean Discrepancy tussen voorwaartse en achterwaartse Markov-trajecten onder de beperking van reversibiliteit, het mogelijk maakt om te leren van complexe, niet-genormaliseerde verdelingen in continue, discrete en hybride ruimtes zonder gebruik te maken van gradients of scorefuncties.

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Dit artikel introduceert nieuwe, efficiënt berekenbare transductieve generalisatiegrenzen voor grafnodeclassificatie op basis van optimale transport en Wasserstein-afstanden, die empirisch beter presteren dan klassieke complexiteitsmaten en het niet-monotone effect van GNN-diepte op generalisatie verklaren.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Dit artikel vult bestaande kennisgaten over de spijtbegrensingen van Gaussian Process Thompson Sampling (GP-TS) in door zowel een ondergrens als verbeterde bovengrenzen voor de verwachte, leniente en cumulatieve spijt af te leiden, waarbij wordt aangetoond dat GP-TS een polynoomafhankelijkheid van $1/\delta$ vertoont en dat recente verbeteringen voor GP-UCB ook op GP-TS van toepassing zijn.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Dit paper presenteert een niet-asymptotisch resultaat dat de trainingsdynamica van machine learning-modellen onder een Gaussisch mengselmodel koppelt aan een makkelijker te analyseren surrogaat-dynamisch systeem, waarbij gebruik wordt gemaakt van de Gordon-vergelijkingstheorema om de geldigheid van dynamische mean-field-expressies te bewijzen en een iteratief verfijningsschema voor niet-asymptotische scenario's voor te stellen.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

Deze paper introduceert Robust Regularized Policy Iteration (RRPI), een methode voor offline versterkend leren die prestatie-degradatie door verdelingsverschuiving en transitie-onzekerheid aanpakt door het leerproces te formuleren als robuuste optimalisatie tegenover de slechtst mogelijke dynamica binnen een onzekerheidsset, wat resulteert in een efficiënt iteratief algoritme met theoretische convergentiegaranties en superieure prestaties op D4RL-benchmarks.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Dit paper introduceert VMoER, een schaalbaar Bayesiaans framework dat variational inference toepast op de routering in Mixture-of-Experts Transformers om zo met minimale rekentijd gecalibreerde onzekerheidsschattingen te bieden voor foundation modellen.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Dit paper introduceert BRACE, een parameterloos algoritme voor bandietenproblemen met non-compliance dat simultane validiteit garandeert voor zowel aanbevelings- als behandelingsbeleid en structurele onzekerheid certificeert, zelfs bij zwakke identificatie of heterogeniteit.

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

Dit paper introduceert a-TMFG, een schaalbaar algoritme dat de beperkingen van de traditionele TMFG-methode voor grote datasets overwint door gebruik te maken van benaderde k-NN-grafen en dynamische correlatieschatting.

Lionel YelibiWed, 11 Ma🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

Deze paper introduceert een unifyend kader voor traditionele en convexe niet-negatieve matrixfactorisatie (NMF) met Tweedie- en Negatief Binomiale kostenfuncties, waarbij nieuwe Majorize-Minimiseer-update-regels worden afgeleid en empirisch gevalideerd om te tonen dat de keuze van het ruismodel cruciaal is voor modelfit en dat convexe NMF een robuust alternatief biedt bij grote aantallen klassen.

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

Murmurations: a case study in AI-assisted mathematics

Dit artikel beschrijft het experimenteel ontdekte fenomeen van 'murmuraties', een nieuw wiskundig verschijnsel in de getaltheorie dat met behulp van AI-interpretatietools is geanalyseerd en diepe inzichten biedt in de Frobenius-sporen en de conjectuur van Birch en Swinnerton-Dyer.

Yang-Hui He, Kyu-Hwan Lee, Thomas Oliver, Alexey PozdnyakovWed, 11 Ma📊 stat

Upper Generalization Bounds for Neural Oscillators

Dit artikel leidt theoretische bovenste generalisatiegrenzen af voor neurale oscillatoren, gebaseerd op tweede-orde differentiaalvergelijkingen en multilayer perceptrons, en toont aan dat het beperken van de Lipschitz-constanten via regularisatie de generalisatieprestaties verbetert, wat wordt bevestigd door numerieke validatie op een Bouc-Wen-systeem.

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Dit paper introduceert een nieuw hiërarchisch multi-task multi-fidelity framework voor Gaussian processen dat de uitdagingen van grote databehoeften en heterogene datakwaliteit in de productie-effectieve surrogate-modellering tegelijkertijd aanpakt, wat resulteert in een tot 23% hogere voorspellingnauwkeurigheid.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Dit paper introduceert een nieuwe familie van gemiddeld genormaliseerde operatornormen en de MOGA-optimizer om breedte-onafhankelijke stabiliteit en effectieve hyperparameter-overdracht te garanderen voor neurale netwerken, waarbij het de stabiliteit van Muon verbetert en snellere prestaties bereikt in grote-token en laag-verlies regimes.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

In dit paper presenteren de auteurs twee online neurale netwerkbenaderingen voor het detecteren van veranderingen in tijdsreeksen die lineaire computationele complexiteit hebben, sneller convergeren naar optimale oplossingen en beter presteren dan bestaande methoden op zowel synthetische als real-world datasets.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG

← Vorige Volgende →