stat.ML papers | Gist.Science

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Dit artikel analyseert een continu-tijd diffusi benadering van policy gradient voor stochastische bandieten en bewijst dat de spijt afhankelijk is van de leersnelheid, waarbij een optimale leersnelheid nodig is om lineaire spijt te voorkomen.

Tor LattimoreThu, 12 Ma📊 stat

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

In dit artikel wordt een nieuw trust-region interior-point stochastisch sequentieel kwadratisch programmeringsalgoritme (TR-IP-SSQP) voorgesteld voor het oplossen van optimalisatieproblemen met een stochastische doelfunctie en deterministische niet-lineaire constraints, waarvan de globale convergentie naar stationaire punten wordt bewezen en de praktische prestaties worden getest op CUTEst-problemen en logistische regressie.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Dit artikel toont aan dat wanneer de prior in een Bayesiaans hiërarchisch model een canonieke verdeling is, de resulterende afhankelijke marginale prior ook een maximum-entropie-eigenschap bezit, maar dan met een andere constraint op de marginale verdeling van een functie van de onbekende grootheden.

Brendon J. BrewerThu, 12 Ma📊 stat

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Dit artikel introduceert MultiwayPAM, een nieuwe tensor-clusteringmethode die de rekentijd en inherent bias van LLM-as-a-Judge-evaluaties vermindert door gelijktijdig clusterleden en medoïden te schatten voor vragen, antwoordgevers en beoordelaars.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Deze paper introduceert een nieuwe ondergrens en het $\textsf{Adjacent-BAI}$ -algoritme voor het identificeren van de beste arm in niet-stationaire lineaire bandieten, waarmee de complexiteit voor willekeurige armsets wordt vastgesteld en de eerder te pessimistische, dimensie-afhankelijke ondergrens wordt overtroffen.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Designing Service Systems from Textual Evidence

Deze paper introduceert PP-LUCB, een efficiënt algoritme dat de beste serviceconfiguratie identificeert door goedkope, maar bevooroordeelde LLM-gebaseerde scores te combineren met strategisch ingekochte dure menselijke audits, waardoor de auditkosten met 90% worden verlaagd terwijl de nauwkeurigheid behouden blijft.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-LeviThu, 12 Ma🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Dit paper introduceert WiGS, een adaptieve actieve leermethode voor regressie die op basis van versterkingslearning een dynamisch, additief criterium toepast om de labelkosten te verlagen en de nauwkeurigheid te verbeteren, vooral in domeinen met onregelmatige datadichtheid waar bestaande methoden tekortschieten.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

Dit paper introduceert Generalized Gaussian Mixture Processes (GGMPs), een schaalbaar en tractabel raamwerk op basis van Gaussische processen dat multimodale en heteroscedastische conditionele dichtheidsramingen mogelijk maakt door lokale mengsels te combineren met componentuitlijning en per-component training, waardoor de beperkingen van standaard unimodale Gaussische processen worden overwonnen.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Brenier Isotonic Regression

Dit paper introduceert Brenier-isotone regressie, een methode die isotone regressie uitbreidt naar meervoudige uitvoer door de regressiefunctie te modelleren als een cyclisch monotoon veld via optimal transport, wat leidt tot superieure prestaties in waarschijnlijkheidskalibratie en veralgemeende lineaire modellen.

Han Bao, Amirreza Eshraghi, Yutong WangThu, 12 Ma📊 stat

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Dit artikel bewijst dat Dual Space Preconditioned Gradient Descent in het overgeparametriseerde regime convergeert naar een oplossing die de trainingsdata perfect fit, en toont aan dat voor isotrope preconditioners deze oplossing identiek is aan die van standaard gradient descent, terwijl voor algemene preconditioners de afstand tot de initialisatie binnen een constante factor van die van gradient descent blijft.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Deze studie vergelijkt Monte Carlo Dropout en Conformal Prediction voor onzekerheidsschatting in CNN's en concludeert dat GoogLeNet beter gekalibreerd is dan VGG16, terwijl Conformal Prediction statistisch gegarandeerde voorspellingen biedt die essentieel zijn voor betrouwbare AI-toepassingen.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Het artikel introduceert ReTabSyn, een versterkt leerproces voor het synthetiseren van realistische tabulaire data dat door prioriteit te geven aan het leren van conditionele distributies in plaats van de volledige gezamenlijke distributie, de prestaties van downstream-modellen verbetert in scenario's met weinig data en onbalans.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

Kernel Tests of Equivalence

Deze paper introduceert nieuwe op kernen gebaseerde tests voor het beoordelen van de equivalentie tussen verdelingen, die de beperkingen van traditionele goodness-of-fit-tests en bestaande parametrische equivalentietests overwinnen door het gebruik van kernel-Stein-discrepantie en Maximum Mean Discrepancy.

Xing Liu, Axel GandyThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Deze paper introduceert een selectief voorspellingskader voor het terugvinden van molecuulstructuren uit massaspectra dat onzekerheidsmetingen gebruikt om voorspellingen te verwerpen wanneer de kans op fouten te groot is, waardoor betrouwbare annotaties mogelijk worden in kritieke toepassingen.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Dit artikel introduceert een verenigd Bayes-optimalisatiekader met Gaussian processes dat minimalisatie en zadelzoektochten op potentie-energiefuncties versnelt door een uniforme zesstaps-lus, geavanceerde kernel-uitbreidingen en schaalbare random Fourier-features te combineren met pedagogische Rust-implementaties.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Dit artikel introduceert Ancestral GFlowNet (AGFN), een nieuw algoritme dat causale ontdekking onder latent verstorende factoren combineert met zowel voorafgaande als onzekere expertkennis via een Bayesiaanse versterkende leerbenadering, waarbij bewezen wordt dat het convergeert naar het ware causale model.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Dit artikel biedt een uitgebreide review en formele specificatie van voorspellende coderingsnetwerken, een neurobiologisch geïnspireerd raamwerk dat gebruikmaakt van inferentie-leren in plaats van backpropagatie en dat zowel voor toezicht als voor generatieve modellering een veelbelovende basis vormt voor toekomstige innovaties in machine learning.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

Theoretical Foundations of Conformal Prediction

Dit boek biedt een pedagogische en verenigde presentatie van de fundamentele technische argumenten en bewijzen voor conformale voorspelling en gerelateerde distributie-vrije inferentietechnieken, die waardevolle onzekerheidskwalificatiegaranties bieden voor complexe machinelearning-systemen zonder aannames over de data-genererende verdeling.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Deze paper introduceert een $\ell_0$ -geregulariseerde variant van de kwadratische oppervlakte support vector machine die overfitting en interpretatieproblemen oplost door middel van een efficiënt straffingsontbindingsalgoritme dat wiskundig bewezen optimale oplossingen levert en uitstekende prestaties laat zien op zowel benchmark- als kredietdatasets.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Dit artikel introduceert een variant van Polyak-stappenstappen voor entropische spiegelafdaal om lineaire systemen op te lossen zonder restrictieve aannames, waarbij sublineaire en lineaire convergentie wordt bewezen, de impliciete bias in de $\ell_1$ -norm wordt versterkt, en een alternatieve, exponentiatieloze methode met bewezen convergentie wordt voorgesteld.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG

← Vorige Volgende →