stat.ML Arbeiten | Gist.Science

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Diese Arbeit analysiert eine Diffusionsapproximation des Policy-Gradient-Verfahrens für stochastische Banditen, indem sie zeigt, dass bei einer Lernrate von $\eta = O(\Delta^2/\log(n))$ ein logarithmisches Regret von $O(k \log(k) \log(n) / \eta)$ erreicht wird, während für bestimmte Instanzen mit logarithmisch vielen Armen eine lineare Lernrate $\eta = O(\Delta^2)$ erforderlich ist, um lineares Regret zu vermeiden.

Tor LattimoreThu, 12 Ma📊 stat

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

Dieses Paper stellt eine neue Trust-Region-Innenpunkt-Stochastische-Sequentielle-Quadratische-Programmierung-Methode (TR-IP-SSQP) vor, die stochastische Zielfunktionen mit deterministischen nichtlinearen Nebenbedingungen löst, globale Konvergenz unter Standardannahmen garantiert und ihre praktische Leistungsfähigkeit an CUTEst-Problemen sowie logistischen Regressionen demonstriert.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad LavaeiThu, 12 Ma🔢 math

Bayesian Hierarchical Models and the Maximum Entropy Principle

Die Arbeit zeigt, dass die abhängige Randverteilung in bayesschen hierarchischen Modellen, bei denen die bedingte Prior-Verteilung eine kanonische Maximum-Entropie-Verteilung ist, ebenfalls eine Maximum-Entropie-Eigenschaft bezüglich einer anderen Randverteilungsbedingung aufweist, was die impliziten Annahmen solcher Modelle verdeutlicht.

Brendon J. BrewerThu, 12 Ma📊 stat

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Die vorgestellte Arbeit stellt MultiwayPAM vor, eine neue Tensor-Clustering-Methode, die durch die gleichzeitige Schätzung von Clusterzugehörigkeiten und Medoiden für Fragen, Antwortende und Bewerter hilft, die Rechenkosten und die inhärente Verzerrung bei der Bewertung von Texten durch LLMs zu adressieren und die Struktur dieser Bias aufzudecken.

Chihiro Watanabe, Jingyu SunThu, 12 Ma📊 stat

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Die Arbeit untersucht das Problem der Identifizierung des besten Arms in nicht-stationären linearen Banditen mit festem Budget, indem sie eine arm-mengenabhängige untere Schranke für die Fehlerwahrscheinlichkeit herleitet und den zugehörigen $\textsf{Adjacent-BAI}$ -Algorithmus vorschlägt, der diese Schranke bis auf Konstanten erreicht.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam FazelThu, 12 Ma📊 stat

Designing Service Systems from Textual Evidence

Die Arbeit stellt den PP-LUCB-Algorithmus vor, der durch die Kombination von verzerrten LLM-Bewertungen mit kostengünstigen, selektiven menschlichen Audits und einer speziellen Schätzmethode die effiziente Identifizierung optimaler Servicekonfigurationen ermöglicht und dabei die Auditkosten um 90 % senkt.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-LeviThu, 12 Ma🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Die Arbeit stellt Weighted improved Greedy Sampling (WiGS) vor, eine Methode, die das statische Multiplikationsprinzip des Improved Greedy Sampling durch ein dynamisches, auf Reinforcement Learning basierendes additives Kriterium ersetzt, um die Balance zwischen Exploration und Investigation anzupassen und so die Genauigkeit sowie die Effizienz bei der Kennzeichnung von Daten in Regressionen zu verbessern.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormickThu, 12 Ma📊 stat

GGMPs: Generalized Gaussian Mixture Processes

Die Arbeit stellt den Generalized Gaussian Mixture Process (GGMP) vor, einen skalierbaren, auf Gauß-Prozessen basierenden Ansatz zur effizienten Schätzung multimodaler bedingter Dichten, der die Beschränkungen standardmäßiger unimodaler Gauß-Prozesse überwindet.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. NoackThu, 12 Ma🤖 cs.LG

Brenier Isotonic Regression

Der Artikel stellt die „Brenier-Isotone Regression" vor, eine Erweiterung der klassischen isotonen Regression auf multivariate Ausgaben durch die Nutzung zyklischer Monotonie und optimaler Transporttheorie, die sich in Anwendungen wie der Wahrscheinlichkeitskalibrierung als überlegen erweist.

Han Bao, Amirreza Eshraghi, Yutong WangThu, 12 Ma📊 stat

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Diese Arbeit beweist die Konvergenz von dualraumvorkonditioniertem Gradientenabstieg auf eine interpolierende Lösung im überparametrisierten Regime und analysiert dessen implizite Verzerrung, wobei gezeigt wird, dass isotrope Vorkonditionierer die gleiche Lösung wie der Standard-Gradientenabstieg liefern.

Reza Ghane, Danil Akhtiamov, Babak HassibiThu, 12 Ma📊 stat

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Diese Studie vergleicht Monte-Carlo-Dropout und konforme Vorhersage zur Unsicherheitsquantifizierung in CNNs auf Fashion-MNIST und zeigt, dass GoogLeNet besser kalibriert ist als das genauere H-CNN VGG16, wobei konforme Vorhersage durch statistisch garantierte Vorhersagemengen besonders für hochriskante Entscheidungen wertvoll ist.

Sanne Ruijs, Alina Kosiakova, Farrukh JavedThu, 12 Ma📊 stat

ReTabSyn: Realistic Tabular Data Synthesis via Reinforcement Learning

Das Paper stellt ReTabSyn vor, eine auf Reinforcement Learning basierende Methode zur realistischen Synthese tabellarischer Daten, die durch den Fokus auf die bedingte Verteilung $P(y\mid \bm{X})$ und direktes Feedback zur Erhaltung von Merkmalskorrelationen insbesondere bei kleinen, unausgewogenen Datensätzen die Leistungsfähigkeit nachgelagerter Modelle verbessert.

Xiaofeng Lin, Seungbae Kim, Zhuoya Li, Zachary DeSoto, Charles Fleming, Guang ChengThu, 12 Ma📊 stat

Kernel Tests of Equivalence

Dieser Beitrag stellt neuartige Kernel-basierte Tests vor, die unter Verwendung der Kernel-Stein-Diskrepanz und der Maximum-Mean-Diskrepanz die Äquivalenz von Verteilungen überprüfen und damit die Grenzen traditioneller Anpassungstests überwinden, indem sie das Fehlen statistisch relevanter Unterschiede mit kontrollierten Fehlerquoten nachweisen.

Xing Liu, Axel GandyThu, 12 Ma📊 stat

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Die Studie stellt einen Rahmen für die selektive Vorhersage zur Massenspektren-basierten Molekülidentifikation vor, der durch die Nutzung von Unsicherheitsquantifizierung auf Abfrageebene und verteilungsfreien Risikokontrollen eine zuverlässige Abstimmung zwischen Vorhersagegenauigkeit und Abdeckung ermöglicht.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem WaegemanThu, 12 Ma📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Diese Arbeit stellt ein einheitliches Bayesian-Optimization-Framework mit Gauß-Prozessen vor, das die Suche nach stationären Punkten auf Potentialenergieflächen durch einen gemeinsamen Sechs-Schritte-Schleifenansatz, erweiterte Kernel-Methoden und effiziente Skalierung für hochdimensionale Systeme beschleunigt.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)Thu, 12 Ma📊 stat

Expert-Aided Causal Discovery of Ancestral Graphs

Diese Arbeit stellt Ancestral GFlowNet (AGFN) vor, einen neuartigen Reinforcement-Learning-Algorithmus, der die kausale Entdeckung unter latenten Störgrößen ermöglicht, indem er sowohl vorab eingebrachtes als auch unsicheres nachträgliches Expertenwissen integriert und dabei durch eine bayessche Modellierung des Feedbacks zur wahren kausalen Struktur konvergiert.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena RibeiroMon, 09 Ma🤖 cs.LG

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Dieses Tutorial und die Übersicht stellen Predictive Coding Networks als eine vielversprechende, biologisch plausible und mathematisch übergeordnete Alternative zum Backpropagation-Algorithmus vor, die durch Inferenzlernen effizientere und vielseitigere Architekturen für überwachtes und unüberwachtes Lernen ermöglicht.

Björn van Zwol, Ro Jefferson, Egon L. van den BroekMon, 09 Ma🤖 cs.AI

Theoretical Foundations of Conformal Prediction

Dieses Buch fasst die theoretischen Grundlagen und wichtigen Beweisstrategien der konformen Vorhersage zusammen, um verteilungsfreie Unsicherheitsquantifizierung für maschinelles Lernen in einer einheitlichen und pädagogischen Sprache zugänglich zu machen.

Anastasios N. Angelopoulos, Rina Foygel Barber, Stephen BatesMon, 09 Ma🔢 math

L0-Regularized Quadratic Surface Support Vector Machines

Die Autoren stellen l0-regularisierte quadratische Oberflächen-Support-Vektor-Maschinen vor, die durch eine Penalty-Decomposition-Algorithmik sparsame und generalisierbare Klassifikatoren ohne Kernel-Funktionen ermöglichen und dabei auf Benchmark-Daten sowie im Bereich der Kreditwürdigkeitsprüfung überzeugen.

Ahmad Mousavi, Ramin Zandvakili, Zheming GaoMon, 09 Ma🤖 cs.LG

Entropic Mirror Descent for Linear Systems: Polyak's Stepsize and Implicit Bias

Diese Arbeit führt eine Variante von Polyak-Schrittweiten ein, um die Entropie-Spiegelabstiegsmethode für lineare Systeme auf unbeschränkten Domänen mit konvergenzbeweisen zu analysieren, dabei die implizite Verzerrung in der $\ell_1$ -Norm zu verbessern und die Ergebnisse auf allgemeine konvexe $L$ -glatte Funktionen zu verallgemeinern.

Yura Malitsky, Alexander PoschMon, 09 Ma🤖 cs.LG

← Zurück Weiter →