stat.ML Arbeiten | Gist.Science

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Diese Arbeit führt ein intrinsisches Drift-Budget $C_T$ ein, das die kumulative Fisher-Rao-Bewegung der Datenverteilung in geschlossenen Lernsystemen quantifiziert und zeigt, dass die Reproduzierbarkeit der Vorhersagen durch eine untere Schranke von $T^{-1/2} + C_T/T$ bestimmt wird, welche die unvermeidbare Genauigkeitsgrenze bei nicht vernachlässigbarer Drift festlegt.

Sofiya Zaichyk2026-03-05🤖 cs.LG

Synthetic Augmentation in Imbalanced Learning: When It Helps, When It Hurts, and How Much to Add

Diese Arbeit entwickelt ein statistisches Rahmenwerk, das zeigt, dass synthetische Daten bei unausgewogenen Klassifizierungsproblemen nicht immer vorteilhaft sind, und empfiehlt die Methode VTSS zur optimalen Bestimmung der Anzahl synthetischer Stichproben basierend auf Validierungsverlusten.

Zhengchi Ma, Anru R. Zhang2026-03-05🤖 cs.LG

Universal Coefficients and Mayer-Vietoris Sequence for Groupoid Homology

Diese Arbeit untersucht die Homologie ample Gruppenoiden mittels des Moore-Komplexes mit kompaktem Träger, beweist eine universelle Koeffizienten-Exaktheitssequenz für diskrete Koeffizienten, analysiert die Hindernisse für nicht-diskrete Koeffizienten und leitet eine Mayer-Vietoris-Folge für die Berechnung dieser Homologiegruppen ab.

Luciano Melodia2026-03-05🤖 cs.LG

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Die vorgestellte Arbeit schlägt ein tensorfaktorisierungsbasiertes statistisches Modell vor, das kostengünstige automatische Bewertungen mit einer kleinen Menge menschlicher Referenzdaten kombiniert, um effiziente, promptgenaue Evaluierungen von Generativmodellen durchzuführen, die menschliche Präferenzen präziser vorhersagen als herkömmliche Methoden.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Causal Learning Should Embrace the Wisdom of the Crowd

Dieses Papier plädiert für ein neues Paradigma der kausalen Lernforschung, das durch die Integration von Crowdsourcing, Expertenwissen und KI-Simulationen eine verteilte Entscheidungsfindung ermöglicht, um globale kausale Strukturen zu rekonstruieren, die für einzelne Akteure unzugänglich sind.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

The Theory behind UMAP?

Dieser Artikel korrigiert Fehler in der ursprünglichen UMAP-Theorie von McInnes et al., die auf Spivaks unveröffentlichtem Entwurf basieren, und liefert eine vollständige, selbstständige Herleitung der zugrunde liegenden Funktoren sowie eine kritische Diskussion des UMAP-Algorithmus.

David Wegmann2026-03-05🤖 cs.LG

Learning Order Forest for Qualitative-Attribute Data Clustering

Dieser Artikel stellt eine neue Clustering-Methode für qualitative Daten vor, die durch ein gemeinsames Lernverfahren einen „Learning Order Forest" aus Baumstrukturen erzeugt, um komplexe Ordnungsbeziehungen zwischen Attributwerten zu erfassen und so präzisere Clusterergebnisse als herkömmliche Ansätze zu erzielen.

Mingjie Zhao, Sen Feng, Yiqun Zhang + 3 more2026-03-05🤖 cs.AI

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Diese Arbeit stellt eine neuartige, adaptive Parameterauswahlstrategie für kernelbasierte Gradientenabstiegsverfahren vor, die durch die Integration von Bias-Varianz-Analyse und empirischer effektiver Dimension optimale Generalisierungsgrenzen erreicht und sich effektiv an verschiedene Kernel, Zielfunktionen und Fehlermetriken anpasst.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Surprisal-Rényi Free Energy

Dieses Paper stellt die Surprisal-Rényi-Free-Energy (SRFE) als ein neuartiges, log-momentenbasiertes Funktional vor, das die Vorwärts- und Rückwärts-KL-Divergenzen als Grenzfälle umfasst und durch eine explizite Mittelwert-Varianz-Tradeoff-Struktur sowie eine präzise Minimum-Description-Length-Interpretation die geometrischen und großen-Abweichungs-Eigenschaften dieser Lernrahmenwerke aufklärt.

Shion Matsumoto, Raul Castillo, Benjamin Prada + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Die Autoren stellen ein skalierbares Modell zur kausalen Entdeckung vor, das unter der Annahme unbekannter weicher Interventionen durch kontrastives Lernen über Beobachtungs- und Interventionsregimes hinweg eine global konsistente kausale Struktur rekonstruiert und dabei theoretisch fundierte Verbesserungen gegenüber nicht-kontrastiven Methoden sowie eine bessere Generalisierungsfähigkeit bietet.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Die Autoren stellen einen minimax-optimalen Algorithmus für das Reinforcement Learning mit verzögerten Zustandsbeobachtungen vor, der durch die Kombination von Augmentierung und Upper Confidence Bound eine Regret-Schranke von $\tilde{\mathcal{O}}(H \sqrt{D_{\max} SAK})$ erreicht und durch ein passendes unteres Limit als optimal nachgewiesen wird.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Die Studie zeigt, dass die exponentielle Dimensionalität der von neuronalen Netzen wahrgenommenen Konstruktionsräume im Vergleich zu menschlichen Konzepten eine fundamentale Fehlausrichtung darstellt, die als Hauptursache für adversarial examples gilt und nur durch eine Angleichung dieser Dimensionen überwunden werden kann.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Das Paper stellt CausalMix vor, ein variationsbasiertes generatives Framework, das durch die Kombination von Misch-Gauß-Verteilungen und datentypspezifischen Dekodern sowohl realistische gemischte tabellarische Daten erzeugt als auch eine präzise, unabhängige Kontrolle über kausale Mechanismen wie Überlappung, Konfundierung und Heterogenität des Behandlungseffekts ermöglicht.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

Empirical Evaluation of No Free Lunch Violations in Permutation-Based Optimization

Die Studie zeigt, dass algebraische Umformulierungen von Zielfunktionen und die Wahl der Benchmark-Designs zu signifikanten, lokal strukturierten Abweichungen von der No-Free-Lunch-Intuition führen, was eine problemklassen- und darstellungsabhängige Algorithmenauswahl in der evolutionären Berechnung und statistischen Inferenz notwendig macht.

Grzegorz Sroka2026-03-05🔢 math

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Diese Arbeit entwickelt ein rigoroses Framework zur Erweiterung von neuronalen Operatoren für Out-of-Distribution-Eingaben durch Kernel-Approximation und RKHS-Theorie, was eine zuverlässige Erfassung von Funktionswerten und Ableitungen ermöglicht und an elliptischen PDEs auf Mannigfaltigkeiten validiert wird.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Diese Arbeit beweist die starke Konvergenz mit der Ordnung 1/2 für ein geometrisches Euler-Maruyama-Schema zur Diskretisierung von Riemannischen Langevin-Dynamiken auf Mannigfaltigkeiten und leitet daraus eine Wasserstein-Schranke für das Sampling auf diesen Mannigfaltigkeiten ab.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

A Stein Identity for q-Gaussians with Bounded Support

Dieses Paper leitet eine neue Stein-Identität für q-Gaußsche Verteilungen mit beschränktem Träger her, die durch die Verwendung von Eskort-Verteilungen und die Erweiterung bestehender Theoreme Gradientenschätzer mit nahezu gleicher Form wie bei Gaußschen Verteilungen ermöglicht und so die Varianz in Anwendungen wie dem Bayesschen Deep Learning reduziert.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Diese Arbeit leitet unter milden Regularitätsbedingungen endliche Stichprobenfehlerabschätzungen für Score-matching Diffusionsmodelle her, die zeigen, dass die Konvergenzrate in der Wasserstein- $p$ -Metrik von der intrinsischen $(p,q)$ -Wasserstein-Dimension der Daten abhängt und somit den Fluch der Dimensionalität überwindet, ohne Kompaktheits- oder Glattheitsannahmen zu benötigen.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Die Arbeit stellt ein Zwei-Phasen-Rahmenwerk namens Suffix Imitation vor, das es einem passiven Beobachter ermöglicht, ohne Zugriff auf Belohnungen die optimalen Parameter eines nicht-stationären Lernenden zu rekonstruieren und dabei eine Konvergenzrate von $\tilde O(1/\sqrt{N})$ zu erreichen, die der eines belohnungsbewussten Lernenden entspricht.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG

Observationally Informed Adaptive Causal Experimental Design

Die Arbeit stellt R-Design vor, ein adaptives Design-Framework für kausale Experimente, das durch die Nutzung von Beobachtungsdaten als Prior und die gezielte Schätzung von Residuen mittels des R-EPIG-Kriteriums die Effizienz von Randomized Controlled Trials im Vergleich zu herkömmlichen Ansätzen signifikant steigert.

Erdun Gao, Liang Zhang, Jake Fawkes + 5 more2026-03-05🤖 cs.LG

← Zurück Weiter →