stat.ML Arbeiten | Gist.Science

Towards Reliable Simulation-based Inference

Diese Dissertation adressiert das Problem übermäßiger Selbstsicherheit bei simulationsbasierten Inferenzmethoden durch die Entwicklung und Evaluierung von Regularisierungstechniken wie „Balancing" sowie durch den Einsatz maßgeschneiderter Bayesianischer neuronaler Netze, um zuverlässigere und besser kalibrierte statistische Schlussfolgerungen zu gewährleisten.

Arnaud DelaunoyWed, 11 Ma🤖 cs.LG

Estimation of heterogeneous principal effects under principal ignorability

Diese Arbeit stellt einen Rahmen zur Schätzung und Inferenz heterogener Haupteffekte unter der Annahme der Hauptignorierbarkeit vor, entwickelt mehrere Schätzer mit unterschiedlichen Robustheitseigenschaften und wendet diese auf Daten aus dem Camden Coalition-Hotspotting-Randomisierten-Test an.

Rui Zhang, Charles R. Doss, Jared D. HulingWed, 11 Ma📊 stat

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Diese Arbeit entwickelt einen axiomatischen Ansatz für datengetriebene, robuste Markov-Entscheidungsprozesse auf Borel-Räumen, der mittels empirischer Verteilungen und Ambiguitätsmengen, die auf Distanzfunktionen basieren, Konvergenzgarantien, Stichprobenkomplexitätsgrenzen und Wahrscheinlichkeitsaussagen für die Out-of-Sample-Leistung liefert, während sie gleichzeitig die mangelnde Robustheit rein empirischer MDPs aufzeigt.

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Dieses Buch interpretiert generative KI-Modelle, insbesondere Flow Matching, als statistische Werkzeuge zur nichtparametrischen Verteilungslernung und integriert sie durch Orthogonalisierung und Cross-Fitting in ein robustes Inferenzframework für Anwendungen wie kausale Analyse, Survival-Analyse und Imputation.

Shinto EguchiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

Diese Arbeit verifiziert, dass persistente Beobachter in kausal invarianten Hypergraphen die Bedingungen des Good-Regulator-Theorems erfüllen, wodurch sich natürliche Gradientenabstiegsverfahren als einzig zulässige Lernregel ergeben und eine modellabhängige Verbindung zwischen Wolframs und Vanchurins Theorien mit einem quanten-klassischen Schwellenwert bei κ(F)=2 hergestellt wird.

Max ZhuravlevWed, 11 Ma🤖 cs.LG

Better Bounds for the Distributed Experts Problem

Dieses Paper stellt ein Kommunikationsprotokoll für das verteilte Expertenproblem vor, das im Vergleich zu früheren Arbeiten eine verbesserte Regret-Schranke bei minimalem Kommunikationsaufwand erreicht.

David P. Woodruff, Samson ZhouWed, 11 Ma🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Die vorgestellte Arbeit entwickelt einen einheitlichen, zielgradientenfreien generativen Sampler, der durch die Minimierung der Maximum Mean Discrepancy zwischen vorwärts- und rückwärtsgerichteten Trajektorien unter Einhaltung der Reversibilität komplexe Verteilungen in kontinuierlichen, diskreten und hybriden Räumen effizient sampelt.

Lei Li, Zhen Wang, Lishuo ZhangWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Diese Arbeit stellt neue, effizient berechenbare transduktive Generalisierungsgrenzen für Graph-Node-Klassifizierung vor, die auf Optimal-Transport-Maßen basieren und durch die Analyse von GNN-Aggregationen sowohl die empirische Generalisierung als auch den nicht-monotonen Einfluss der Netzwerktiefe auf den Fehler erklären.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Diese Arbeit schließt bestehende Lücken in der Analyse von Gaussian-Process-Thompson-Sampling (GP-TS) für das Bayesianische Optimieren, indem sie erstmals eine untere Regret-Schranke, eine verbesserte obere Schranke für die kumulative Regret über die Zeit $T$ sowie erwartete „lenient"-Regret-Schranken und eine Schranke für die zweite Moment der kumulativen Regret herleitet.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Diese Arbeit leitet einen nicht-asymptotischen Vergleichssatz für das Training von Machine-Learning-Modellen auf Basis von Gaußschen Mischmodellen her, der die Dynamik mit einem einfacher zu analysierenden Surrogat-System verbindet und die Gültigkeit der dynamischen Mean-Field-Approximationen rigoros beweist.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

Robust Regularized Policy Iteration under Transition Uncertainty

Die Arbeit stellt Robust Regularized Policy Iteration (RRPI) vor, einen neuen Algorithmus für Offline-Reinforcement-Learning, der durch die Formulierung als robuste Optimierung unter Transitionsunsicherheit und die Nutzung eines KL-regulierten Surrogats eine effiziente und theoretisch fundierte Lösung bietet, die auf D4RL-Benchmarks überlegene Leistung und verbesserte Robustheit gegenüber Ausreißern zeigt.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu ZhangWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Die Arbeit stellt VMoER vor, einen skalierbaren bayesschen Ansatz, der die Unsicherheitsquantifizierung in Mixture-of-Experts-Transformern durch eine strukturierte Inferenz im Routing-Mechanismus ermöglicht und dabei die Kalibrierung sowie die Stabilität bei gleichzeitiger Minimierung des Rechenaufwards erheblich verbessert.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

Die Arbeit führt BRACE ein, einen parameterfreien Algorithmus für Banditen mit Nichtkonformität, der durch eine klare Unterscheidung zwischen Empfehlungswohlfahrt und Behandlungseffekten sowie durch zertifizierte Intervalle sowohl die optimale Empfehlungsstrategie als auch die strukturell optimale Behandlungsstrategie unter Unsicherheit und schwacher Identifikation zuverlässig ermittelt.

Nicolás Della PennaWed, 11 Ma🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

Die vorgestellte Arbeit stellt den a-TMFG-Algorithmus vor, der durch die Nutzung von k-Nächste-Nachbarn-Graphen und eine On-the-Fly-Schätzung von Korrelationen die Skalierbarkeit des traditionellen TMFG-Verfahrens auf Datensätze mit Millionen von Beobachtungen ermöglicht.

Lionel YelibiWed, 11 Ma🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

Dieses Papier stellt ein einheitliches Framework für traditionelle und konvexe nicht-negative Matrixfaktorisierung (NMF) unter Verwendung von Tweedie- und Negativ-Binomial-Kostenfunktionen vor, leitet Multiplikations-Update-Regeln mittels Majorize-Minimisation ab und zeigt durch empirische Evaluierungen, dass die Wahl des Rauschmodells sowie der Einsatz konvexer NMF die Anpassungsgüte und Merkmalswiederherstellung signifikant verbessern.

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

Murmurations: a case study in AI-assisted mathematics

Der Artikel beschreibt die Entdeckung und Analyse eines neuen arithmetischen Phänomens namens „Murmurationen", das durch KI-Methoden identifiziert wurde und subtile Informationen über Frobenius-Spuren im Kontext der Birch-und-Swinnerton-Dyer-Vermutung sowie der Zufallsmatrixtheorie kodiert.

Yang-Hui He, Kyu-Hwan Lee, Thomas Oliver, Alexey PozdnyakovWed, 11 Ma📊 stat

Upper Generalization Bounds for Neural Oscillators

Diese Arbeit leitet theoretische obere PAC-Generalisierungsschranken für neuronale Oszillatoren auf Basis von ODEs und MLPs her, zeigt, dass die Fehlerpolynome in MLP-Größe und Zeitlänge wachsen, und bestätigt durch numerische Studien, dass die Regularisierung der Lipschitz-Konstanten die Generalisierungsfähigkeit bei begrenzten Trainingsdaten verbessert.

Zifeng Huang, Konstantin M. Zuev, Yong Xia, Michael BeerWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Diese Arbeit stellt ein neuartiges hierarchisches Multi-Task-Multi-Fidelity-Framework für Gaußsche Prozesse vor, das durch die gleichzeitige Nutzung von Ähnlichkeiten zwischen Aufgaben und fidelityabhängigen Datenmerkmalen die Vorhersagegenauigkeit bei der Surrogatmodellierung in Fertigungssystemen signifikant verbessert.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Die Arbeit führt eine neue Familie von mittelnormalisierten Operator-Normen ein, um stabilen Lernraten-Transfer über verschiedene Netzwerkbreiten hinweg zu ermöglichen, und stellt den darauf basierenden Optimierer MOGA vor, der in großen Sprachmodellen mit Muon konkurrierbar ist und dabei schneller konvergiert.

Ruihan Xu, Jiajin Li, Yiping LuWed, 11 Ma🤖 cs.LG

Online Neural Networks for Change-Point Detection

In diesem Paper werden zwei auf neuronalen Netzen und Online-Lernen basierende Verfahren zur Erkennung von Strukturbrüchen in großen Zeitreihen vorgestellt, die sich durch lineare Komplexität, Überlegenheit gegenüber bestehenden Methoden und bewiesene Konvergenz auszeichnen.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis DerkachTue, 10 Ma🤖 cs.LG

← Zurück Weiter →