stat.ML Arbeiten | Gist.Science

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

Dieser Beitrag stellt eine kostengesteuerte Methode zur Erlernung von Zustandsrepräsentationen für die lineare quadratische Gaußsche (LQG) Steuerung vor und liefert erstmals endliche Stichproben-Garantien für die Konvergenz zu einem nahezu optimalen Regler, indem ein latentes Modell ausschließlich durch die Vorhersage von Kosten statt von Beobachtungen gelernt wird.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit SraTue, 10 Ma🤖 cs.LG

Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

Diese Arbeit zeigt, dass durch eine sorgfältige Kombination von Stichprobenaufteilung und gezieltem Tuning der Störvariablen-Schätzer (Untersmoothing oder Oversmoothing) sowohl Plug-in- als auch verzerrungskorrigierte Schätzer für doppelt robuste Funktionale über alle Hölder-Glattheitsklassen hinweg minimax-optimal konvergieren können.

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

A Robust Multi-Item Auction Design with Statistical Learning

Die Autoren stellen eine neuartige statistische Lernmethode für Multi-Item-Auktionen vor, die auf nichtparametrischer Dichteschätzung und Konfidenzintervallen basiert, um durch zwei effiziente Strategien die Implementierungskosten zu senken und gleichzeitig hohe Wahrscheinlichkeiten für Fairness, Anreizkompatibilität und individuelle Rationalität bei gleichzeitiger Umsatzmaximierung zu gewährleisten.

Jiale Han, Xiaowu DaiTue, 10 Ma💻 cs

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Die Arbeit stellt OTAD vor, ein neuartiges zweistufiges Verteidigungsmodell, das die Vorteile von adversarialem Training und Lipschitz-Netzen durch die Nutzung optimaler Transporttheorie und konvexer Integration vereint, um Deep-Learning-Systeme sowohl präzise als auch lokal Lipschitz-stetig und damit robust gegenüber unbekannten Angriffen zu machen.

Kuo Gai, Sicong Wang, Shihua ZhangTue, 10 Ma🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Die Arbeit etabliert die statistischen Grundlagen des Mini-Batch-Maximum-Partial-Likelihood-Schätzers (mb-MPLE) für Deep-Cox-Modelle, beweist dessen Konsistenz und asymptotische Normalität und liefert praktische Richtlinien für das Hyperparameter-Tuning sowie die Anwendung in großskaligen Szenarien, in denen herkömmliche Schätzer nicht berechenbar sind.

Lang Zeng, Weijing Tang, Zhao Ren, Ying DingTue, 10 Ma🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Diese Arbeit schlägt einen effizienten Annealed Importance Sampling-Ansatz zur Verbesserung des Variational Learning von Gaussian Process Latent Variable Models vor, der durch eine sequenzielle Transformation der Posterior-Verteilung und eine Reparameterisierung des ELBO robustere Konvergenz und engere Variationsgrenzen als bestehende Methoden erreicht.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John PaisleyTue, 10 Ma🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Die Arbeit stellt BNEM vor, einen auf Bootstrapping und Noised Energy Matching basierenden Boltzmann-Sampler, der effizient und robust IID-Stichproben aus Energiefunktionen generiert und dabei den Stand der Technik in Bezug auf Leistung und Stabilität übertrifft.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-LobatoTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Die Autoren stellen einen allgemeinen Transfer-Learning-Rahmen für das Clustering vor, der einen adaptiven Algorithmus (ATC) nutzt, um die Gemeinsamkeiten zwischen einem Haupt- und einem Hilfsdatensatz automatisch zu nutzen, selbst bei unbekannten Diskrepanzen, und dessen theoretische Optimalität sowie praktische Wirksamkeit in verschiedenen Szenarien nachgewiesen wird.

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Diese Arbeit leitet Fehlergrenzen für den Excess Risk bei Klassifizierungsproblemen mit verrauschten Labels in Deep-Learning-Frameworks ab, indem sie statistische Fehler unter Berücksichtigung von Abhängigkeiten und Approximationsfehler im Vektorraum unter der Low-Dimensional-Manifold-Hypothese analysiert.

Haixia Liu, Boxiao Li, Can Yang, Yang WangTue, 10 Ma🤖 cs.LG

Active Advantage-Aligned Online Reinforcement Learning with Offline Data

Die Arbeit stellt A3RL vor, einen neuen Online-Reinforcement-Learning-Ansatz, der durch eine konfidenzbasierte, aktive Stichprobenstrategie (A3) Offline- und Online-Daten dynamisch kombiniert, um die Stichprobeneffizienz zu steigern und das Vergessen früherer Fähigkeiten zu vermeiden.

Xuefeng Liu, Hung T. C. Le, Siyu Chen, Rick Stevens, Zhuoran Yang, Matthew R. Walter, Yuxin ChenTue, 10 Ma🤖 cs.LG

Adaptive Replication Strategies in Trust-Region-Based Bayesian Optimization of Stochastic Functions

Die Arbeit stellt eine adaptive Replikationsstrategie für trust-region-basierte Bayesianische Optimierung vor, die durch die intelligente Zuweisung wiederholter Bewertungen bei stochastischen Funktionen mit hoher Varianz die Lösungspräzision und Recheneffizienz im Vergleich zu Baseline-Methoden erheblich verbessert.

Mickael Binois (ACUMES), Jeffrey Larson (ANL)Tue, 10 Ma🔢 math

Reinforcement Learning for Individual Optimal Policy from Heterogeneous Data

Dieses Papier stellt einen individualisierten Offline-Verstärkungslernrahmen für heterogene Zeit-stationäre MDPs vor, der mithilfe eines Modells mit individuellen latenten Variablen und des P4L-Algorithmus suboptimale Polices für heterogene Populationen vermeidet und eine schnelle Regret-Konvergenz unter schwachen Annahmen garantiert.

Rui Miao, Babak Shahbaba, Annie QuTue, 10 Ma🤖 cs.LG

Online Decision-Focused Learning

Die Arbeit stellt zwei neue Online-Algorithmen für das Entscheidungsorientierte Lernen in dynamischen Umgebungen vor, die durch Regularisierung und Perturbations-Techniken differenzierbare, nicht-konvexe Probleme lösen und erstmals statische sowie dynamische Regret-Schranken garantieren.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain DurmusTue, 10 Ma🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Diese Studie vergleicht imputationsbasierte Methoden (MICE) mit generativen Modellen wie VAEs und CTGANs für die synthetische Datengenerierung in der Tarifgestaltung und zeigt, dass MICE-Modelle bei geringerer Implementierungskomplexität eine hohe Datenqualität und Konsistenz bei GLM-Modellen bieten.

Yevhen Havrylenko, Meelis Käärik, Artur TuttarTue, 10 Ma🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Diese Arbeit schlägt die Klasse von Methoden F²SA-p vor, die durch die Verwendung von p-ter Ordnung endlichen Differenzen zur Approximation des Hypergradienten die Komplexität für stochastische Bilevel-Optimierungsprobleme mit hochgradig glatten Funktionen auf $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ verbessert und damit nahezu die untere Schranke von $\Omega(\epsilon^{-4})$ erreicht.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao ZhangTue, 10 Ma🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Diese Arbeit stellt eine Methode vor, die Deep Learning mit dem theoretischen Rahmenwerk der dynamischen Eingangsimpedanzen (DICs) kombiniert, um degenerierte Populationen leitfähigkeitsbasierter Neuronmodelle schnell und robust ausschließlich aus Spike-Zeiten zu rekonstruieren.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur FyonTue, 10 Ma🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Diese Arbeit stellt den ersten vollständig empirischen PAC-Bayes-Schranken für Markov-Ketten vor, indem sie eine empirische Schranke für den Pseudo-spektralen Lückenwert bei endlichen Zustandsräumen ableitet und so die Abhängigkeit von unbekannten theoretischen Konstanten überwindet.

Vahe Karagulyan, Pierre AlquierTue, 10 Ma🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Die vorgestellte Arbeit führt GDR-Lerner ein, eine flexible Familie generativer Modelle, die durch Orthogonalität Neyman-orthogonale, doppelrobuste und asymptotisch optimale Schätzer für die Verteilung potenzieller Ergebnisse aus Beobachtungsdaten ermöglichen und dabei bestehende Methoden übertreffen.

Valentyn Melnychuk, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Diese Arbeit stellt die Overlap-Adaptive Regularisierung (OAR) vor, eine neuartige Methode, die die Schätzung des bedingten durchschnittlichen Behandlungseffekts (CATE) in Bereichen mit geringer Überlappung verbessert, indem sie die Regularisierung bestehender Meta-Learner proportional zu den Überlappungsgewichten anpasst.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Diese Arbeit stellt den DRQ-Lerner vor, einen neuartigen Meta-Lerner für Markov-Entscheidungsprozesse, der auf Beobachtungsdaten basiert und durch Eigenschaften wie doppelte Robustheit, Neyman-Orthogonalität und quasi-orakel-effiziente Schätzung eine theoretisch fundierte und flexible Lösung für die Vorhersage individueller Ergebnisse in der personalisierten Medizin bietet.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan FeuerriegelTue, 10 Ma🤖 cs.LG

← Zurück Weiter →