stat.ML Arbeiten | Gist.Science

The Volterra signature

Die Autoren stellen die Volterra-Signatur als eine interpretierbare, universell approximierende und rechnerisch effiziente Merkmalsdarstellung für nicht-Markovsche Zeitreihen vor, die durch lineare ODEs, Zeitreparametrisierungsinvarianz und Kernel-Methoden fundiert ist und in Experimenten klassische Signaturen übertrifft.

Paul P. Hager, Fabian N. Harang, Luca Pelizzari + 1 more2026-03-06💻 cs

Oracle-efficient Hybrid Learning with Constrained Adversaries

Diese Arbeit stellt einen oracle-effizienten Lernalgorithmus für das hybride Online-Lernen unter eingeschränkten Adversaries vor, der durch eine neue Frank-Wolfe-Reduktion und Martingal-Schranken gleichzeitig statistische Optimalität und Recheneffizienz erreicht.

Princewill Okoroafor, Robert Kleinberg, Michael P. Kim2026-03-06💻 cs

K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Diese Arbeit beweist eine rigorose Äquivalenz zwischen dem K-Means-Algorithmus und differenzierbaren Radial-Basis-Funktions-Netzen, indem sie zeigt, dass sich die RBF-Ziele im Grenzfall verschwindender Temperatur zu K-Means konvergieren, und schlägt die Integration von Entmax-1.5 zur Stabilisierung vor, um eine nahtlose Einbettung von Clustering in Deep-Learning-Architekturen zu ermöglichen.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

Optimal Prediction-Augmented Algorithms for Testing Independence of Distributions

Diese Arbeit stellt robuste, vorhersagegestützte Algorithmen für den Unabhängigkeitstest vor, die im worst-case ihre Gültigkeit bewahren, aber bei genauen Vorhersagen die Stichprobenkomplexität signifikant reduzieren und dabei optimale untere Schranken erreichen.

Maryam Aliakbarpour, Alireza Azizi, Ria Stevens2026-03-06💻 cs

sFRC for assessing hallucinations in medical image restoration

Diese Arbeit stellt sFRC (Fourier-Ring-Korrelation auf kleinen Patches) als robuste Methode vor, um Halluzinationen in durch Deep Learning rekonstruierten medizinischen Bildern zu erkennen und zu quantifizieren, indem sie diese über verschiedene Unterabtastungsszenarien hinweg mit Referenzdaten vergleicht.

Prabhat Kc, Rongping Zeng, Nirmal Soni + 1 more2026-03-06🔬 physics

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

Die Studie schlägt vor, dass das Gehirn Erinnerungen durch „vorhersagebasiertes Vergessen" komprimiert, um die Generalisierungsfähigkeit zu optimieren, wobei offline-Replay und iterative Verfeinerung notwendig sind, um diese Kompression unter biologischen Einschränkungen zu erreichen.

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Diese Arbeit schließt eine entscheidende Lücke in der kausalen Entdeckung, indem sie erstmals eine Äquivalenzcharakterisierung und einen lernbasierten Algorithmus für lineare nicht-gaußsche zyklische Modelle mit latenten Variablen ohne strukturelle Annahmen bereitstellt.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Diese Arbeit zeigt, dass die durch Lokalität und Gewichts-Sharing bedingte Architektur-induktive Verzerrung von Faltungsnetzwerken die implizite Regularisierung so verändert, dass diese im Gegensatz zu vollvernetzten Netzen eine erfolgreiche Generalisierung auf hochdimensionalen sphärischen Daten ermöglichen.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Diese Arbeit zeigt, dass bei hochdimensionalen Zufallsdaten der Gradientenabstieg für flache ReLU-Netzwerke mit hoher Wahrscheinlichkeit eine implizite Verzerrung zugunsten der Minimum-L2-Norm-Lösung aufweist, wobei die Abweichung von der exakten Lösung in der Größenordnung von $\Theta(\sqrt{n/d})$ liegt.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Die Arbeit interpretiert das Phänomen der „Edge of Stability" durch Richtungs-Glattheit und erweitert es auf nicht-euklidische Normen, wodurch ein einheitlicher, geometrieaware Schärfe-Maßstab entsteht, der zeigt, dass auch nicht-euklidische Gradientenabstiegsverfahren (wie $\ell_{\infty}$ -Descent oder Block-CD) eine progressive Schärfung bis zu einem Schwellenwert von $2/\eta$ aufweisen.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Die Studie stellt fedCI und fedCI-IOD vor, eine neue Methode für die federierte kausale Entdeckung, die es ermöglicht, unter Berücksichtigung von Datenschutz, heterogenen Variablen und latenten Störfaktoren kausale Zusammenhänge über verteilte Datensätze hinweg zu identifizieren, ohne diese zentralisieren zu müssen.

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics

Die vorgestellte Arbeit führt den sequentiellen Schwellenwert für den Variationskoeffizienten (STCV) ein, einen neuen, datenskalingunabhängigen Regularisierer, der die robuste und zuverlässige Identifikation sparser nichtlinearer Dynamikgesetze aus normalisierten, verrauschten Daten ermöglicht und damit die Schwächen herkömmlicher SINDy-Methoden überwindet.

Jay Raut, Daniel N. Wilke, Stephan Schmidt2026-03-06🤖 cs.LG

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Diese Arbeit stellt einen neuartigen Rahmen vor, der demografische Parität und bedingte demografische Parität durch effiziente Störungen der unbeschränkten optimalen individuellen Entscheidungsregeln in die Schätzung einbindet, um diskriminierende Effekte zu vermeiden, wobei die theoretische Konvergenz und praktische Wirksamkeit durch Simulationen und eine Anwendung auf das Oregon-Gesundheitsversicherungs-Experiment nachgewiesen werden.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Diese Studie zeigt, dass für das optimale Out-of-Distribution-Probing von Vision-Transformern je nach Stärke der Verteilungsverschiebung entweder die Aktivierungen des Feedforward-Netzwerks oder die normalisierten Ausgaben des Multi-Head-Self-Attention-Moduls verwendet werden sollten, um die Leistungstiefs tieferer Schichten zu überwinden.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

Der Artikel stellt die Bayesian Supervised Causal Clustering (BSCC)-Methode vor, die mithilfe von Behandlungseffekten als Zielvariable homogene Patientengruppen identifiziert, um personalisierte Entscheidungen im Gesundheitswesen und in der Politikbewertung zu unterstützen, und validiert diesen Ansatz sowohl an simulierten als auch an realen Daten aus dem dritten International Stroke Trial.

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Die Autoren schlagen asymmetrische Shapley-Werte als ehrliches Maß zur Bewertung der Bedeutung genomischer Merkmale in klinischen Vorhersagemodellen vor, um die Probleme von Kollinearität und bekannten Kausalrichtungen zu adressieren, und stellen effiziente Algorithmen für lokale und globale Analysen vor, die am Beispiel der Progressions-freien Überlebenszeit bei Darmkrebspatienten veranschaulicht werden.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

Bayes with No Shame: Admissibility Geometries of Predictive Inference

Diese Arbeit zeigt, dass die Admissibilität in der prädiktiven Inferenz irreduzibel kriterienrelativ ist, indem sie vier paarweise nicht-nested Admissibilitätsgeometrien identifiziert, die jeweils durch unterschiedliche Zertifikate der Optimalität und inkompatible Optimierungsrahmen charakterisiert werden.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

On the Statistical Optimality of Optimal Decision Trees

Diese Arbeit entwickelt eine umfassende statistische Theorie für empirische Risikominimierungs-Entscheidungsbäume, die durch scharfe Oracle-Ungleichungen und minimax-optimale Raten über neuartige Funktionenklassen die statistische Optimalität und den Kompromiss zwischen Interpretierbarkeit und Genauigkeit unter verschiedenen Rauschbedingungen rigoros begründet.

Zineng Xu, Subhroshekhar Ghosh, Yan Shuo Tan2026-03-06🔢 math

Harnessing Synthetic Data from Generative AI for Statistical Inference

Dieser Artikel bietet eine statistische Übersicht über den Einsatz synthetischer Daten durch generative KI, beleuchtet deren Chancen und methodische Grenzen und leitet daraus Prinzipien sowie praktische Empfehlungen für eine valide Anwendung in Forschung und Praxis ab.

Ahmad Abdel-Azim, Ruoyu Wang, Xihong Lin2026-03-06🤖 cs.LG

Thermodynamic Response Functions in Singular Bayesian Models

Die Arbeit stellt ein einheitliches thermodynamisches Rahmenwerk vor, das durch Posterior-Temperierung induzierte Antwortfunktionen nutzt, um die komplexe Geometrie singulärer statistischer Modelle zu interpretieren und Konzepte wie den realen logarithmischen kanonischen Schwellenwert sowie WAIC und WBIC als thermodynamische Größen zu vereinen.

Sean Plummer2026-03-06🔢 math

← Zurück Weiter →