stat.ML Arbeiten | Gist.Science

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

Die Arbeit stellt SPPCSO vor, eine adaptive, bestrafte Schätzmethode, die Hauptkomponentenregression und $L_1$ -Regularisierung kombiniert, um bei hochdimensionalen, korrelierten Daten mit hohem Rauschen stabile Variablenselektion und präzise Parameterschätzung zu gewährleisten.

Ying Hu, Hu YangMon, 09 Ma🤖 cs.LG

Synthetic Monitoring Environments for Reinforcement Learning

Die Arbeit stellt „Synthetic Monitoring Environments" (SMEs) als eine unendliche Suite konfigurierbarer, kontinuierlicher Steuerungsaufgaben mit bekannten optimalen Strategien vor, die es ermöglichen, Reinforcement-Learning-Algorithmen durch präzise, white-box-Diagnosen und exakte Regret-Berechnungen systematisch zu analysieren und von empirischem Benchmarking zu einer rigorosen wissenschaftlichen Evaluation zu überführen.

Leonard Pleiss, Carolin Schmidt, Maximilian SchifferMon, 09 Ma🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Dieser Artikel stellt die BAEN-SVM vor, ein robustes Support-Vector-Modell, das auf einer neuartigen, beschränkten und asymmetrischen Elastic-Net-Verlustfunktion basiert, um Rauschen effektiv zu bewältigen und die Generalisierungsfähigkeit bei binärer Klassifikation zu verbessern.

Haiyan Du, Hu YangMon, 09 Ma🤖 cs.LG

Certified and accurate computation of function space norms of deep neural networks

Diese Arbeit stellt einen Rahmen für die zertifizierte und genaue Berechnung von Funktionraumnormen tief neuronaler Netze vor, der Intervallarithmetik, adaptive Verfeinerung und quadraturbasierte Aggregation kombiniert, um garantierte Schranken für Integrale und PINN-Residuen zu liefern.

Johannes Gründler, Moritz Maibaum, Philipp PetersenMon, 09 Ma🤖 cs.LG

Bayesian Additive Distribution Regression

Die Arbeit stellt DistBART vor, einen bayesschen nichtparametrischen Ansatz für die Verteilungsregression, der BART-Prioritäten nutzt, um sowohl theoretische Konvergenzgarantien als auch skalierbare Inferenz durch Random-Feature-Approximation zu ermöglichen.

Antonio R. Linero, Soumyabrata Bose, Jared MurrayMon, 09 Ma📊 stat

Semantics-Aware Caching for Concept Learning

Die vorgestellte semantikbewusste Caching-Methode beschleunigt das Konzeptlernen in Wissensbasen durch eine subsumptionsbewusste Zwischenspeicherung von Instanzen und reduziert die Laufzeit sowohl für symbolische als auch neuro-symbolische Reasoner um eine Größenordnung.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga NgomoMon, 09 Ma🤖 cs.LG

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Diese Arbeit stellt ein representationsagnostisches Refutationsframework vor, das theoretische Bedingungen für die Nicht-Identifizierbarkeit des kausalen Behandlungseffekts bei dimensionsreduzierten Repräsentationen herleitet und ein neuronales Verfahren zur Schätzung von Obergrenzen für den daraus resultierenden Verzerrungseffekt entwickelt.

Valentyn Melnychuk, Dennis Frauen, Stefan FeuerriegelFri, 13 Ma📊 stat

Onflow: a model free, online portfolio allocation algorithm robust to transaction fees

Die Arbeit stellt Onflow vor, einen modellfreien, online-fähigen Portfolio-Allokationsalgorithmus, der auf Reinforcement Learning und Gradientenflüssen basiert und sich durch eine robuste Performance bei hohen Transaktionskosten sowie eine hohe Effizienz ohne Annahmen über die Verteilung der Asset-Renditen auszeichnet.

Gabriel Turinici, Pierre BrugiereFri, 13 Ma💰 q-fin

Geometry of Singular Foliations and Learning Manifolds in ReLU Networks via the Data Information Matrix

Die Arbeit zeigt, wie ein mit ReLU-Netzwerken trainierter Klassifikator über die Dateninformationsmatrix eine singuläre Foliationsstruktur auf dem Datenraum offenbart, die fast überall regulär ist und sich für die Analyse von Datenkorrelationen sowie für den Wissenstransfer zwischen Datensätzen nutzen lässt.

Eliot Tron, Rita FioresiFri, 13 Ma📊 stat

Are Bayesian networks typically faithful?

Die Arbeit zeigt, dass unter verschiedenen Parametrisierungen und Regularitätsbedingungen die Menge der faithfulness-erfüllenden Bayesian Networks in einem gegebenen DAG dicht und offen ist, was die Konsistenz von constraint-basierten Kausalitätsalgorithmen auf einer typischen Menge von Verteilungen begründet.

Philip Boeken, Patrick Forré, Joris M. MooijFri, 13 Ma📊 stat

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Diese Arbeit stellt einen neuen orthogonalen Lernalgorithmus namens AU-learner vor, der mithilfe partieller Identifikation scharfe Schranken für die bedingte Verteilung des Behandlungseffekts berechnet, um die aleatorische Unsicherheit in der Kausalanalyse zu quantifizieren.

Valentyn Melnychuk, Stefan Feuerriegel, Mihaela van der SchaarFri, 13 Ma📊 stat

Finance-Informed Neural Network: Learning the Geometry of Option Pricing

Die Studie stellt ein finanztheoriebasiertes neuronales Netzwerk (FINN) vor, das Optionspreise und Absicherungsstrategien durch ein selbstüberwachtes Lernziel zur dynamischen Absicherung ermittelt, wodurch arbitragefreie Preise und konsistente Sensitivitäten auch in komplexen oder datenarmen Marktumgebungen gewährleistet werden.

Amine M. Aboussalah, Xuanze Li, Cheng Chi, Raj PatelFri, 13 Ma💰 q-fin

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Die Autoren stellen zwei Algorithmen (PE-GP-TS und HP-GP-TS) vor, die eine theoretisch fundierte, gemeinsame Auswahl des GP-Priors und Minimierung des Regrets im Rahmen von Thompson Sampling ermöglichen, um die in der Praxis häufig fehlende Kenntnis der Prior-Hyperparameter zu überwinden.

Jack Sandberg, Morteza Haghir ChehreghaniFri, 13 Ma📊 stat

Weighted Random Dot Product Graphs

Diese Arbeit stellt ein nichtparametrisches gewichtetes Random Dot Product Graph-Modell (WRDPG) vor, das durch die Zuordnung latenter Positionen zu Knoten die Verteilung von Kantengewichten über deren Momente beschreibt, um so zwischen Verteilungen mit gleichem Mittelwert zu unterscheiden, und liefert konsistente Schätzer sowie einen generativen Rahmen für die Simulation solcher Netzwerke.

Bernardo Marenco, Paola Bermolen, Marcelo Fiori, Federico Larroca, Gonzalo MateosFri, 13 Ma📊 stat

Distribution estimation via Flow Matching with Lipschitz guarantees

Diese Arbeit leitet unter neuen Annahmen zur Kontrolle der Lipschitz-Konstante einen verbesserten Konvergenzraten für den Wasserstein-Abstand bei Flow Matching ab, der insbesondere hochdimensionale, nicht-log-konkave Verteilungen umfasst.

Lea KunkelFri, 13 Ma📊 stat

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

Diese Arbeit untersucht die Existenz und Berechnung von Busemann-Funktionen im Wasserstein-Raum, leitet geschlossene Formeln für eindimensionale Verteilungen und Gaußsche Maße her und nutzt diese Ergebnisse zur Entwicklung effizienter Sliced-Wasserstein-Methoden für Anwendungen wie Transferlernen.

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas CourtyFri, 13 Ma📊 stat

Refereed Learning

Dieses Paper führt das Konzept des „refereed learning" ein, bei dem ein Lernalgorithmus zwei konkurrierende Beweiser nutzt, um mit minimalem Zugriff auf eine Ground-Truth-Funktion und geringem Kommunikationsaufwand die überlegene von zwei Black-Box-Modellen zu identifizieren, wobei die Effizienz durch untere Schranken als optimal nachgewiesen wird.

Ran Canetti, Ephraim Linder, Connor WagamanFri, 13 Ma📊 stat

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Diese Arbeit stellt eine einheitliche bayesianische Theorie vor, die In-Context-Learning und Aktivierungssteuerung als Mechanismen beschreibt, die das Verhalten von Sprachmodellen durch die Veränderung latenter Konzeptglaubenswerte steuern, wobei ersteres als Evidenzakkumulation und letzteres als Prior-Anpassung interpretiert wird.

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh LubanaFri, 13 Ma📊 stat

Approximate Bayesian inference for cumulative probit regression models

Die Autoren stellen drei skalierbare Algorithmen auf Basis von Variational Bayes und Expectation Propagation vor, um die posterior-Verteilung in kumulativen Probit-Modellen für ordinale Daten effizient und präzise zu approximieren, und demonstrieren deren Überlegenheit gegenüber herkömmlichen MCMC-Methoden sowohl in der Rechengeschwindigkeit als auch in der Genauigkeit, unter anderem anhand einer Fallstudie zur Analyse krimineller Netzwerke.

Emanuele AlivertiFri, 13 Ma📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

Die Arbeit löst das Paradoxon der verbundenen, aber isolierten Minima in überparametrisierten neuronalen Netzen auf, indem sie nachweist, dass entropische Barrieren, die durch Krümmungsvariationen und Optimierungsrauschen entstehen, die Dynamik effektiv zu den Endpunkten zurücklenken, selbst wenn der Verlustpfad flach bleibt.

Luca Di Carlo, Chase Goddard, David J. SchwabFri, 13 Ma📊 stat

← Zurück Weiter →