K-Means as a Radial Basis function Network: a Variational and Gradient-based Equivalence

Diese Arbeit beweist eine rigorose Äquivalenz zwischen dem K-Means-Algorithmus und differenzierbaren Radial-Basis-Funktions-Netzen, indem sie zeigt, dass sich die RBF-Ziele im Grenzfall verschwindender Temperatur zu K-Means konvergieren, und schlägt die Integration von Entmax-1.5 zur Stabilisierung vor, um eine nahtlose Einbettung von Clustering in Deep-Learning-Architekturen zu ermöglichen.

Felipe de Jesus Felix Arredondo, Alejandro Ucan-Puc, Carlos Astengo Noguez2026-03-06🔢 math

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Diese Arbeit zeigt, dass bei hochdimensionalen Zufallsdaten der Gradientenabstieg für flache ReLU-Netzwerke mit hoher Wahrscheinlichkeit eine implizite Verzerrung zugunsten der Minimum-L2-Norm-Lösung aufweist, wobei die Abweichung von der exakten Lösung in der Größenordnung von Θ(n/d)\Theta(\sqrt{n/d}) liegt.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Die Arbeit interpretiert das Phänomen der „Edge of Stability" durch Richtungs-Glattheit und erweitert es auf nicht-euklidische Normen, wodurch ein einheitlicher, geometrieaware Schärfe-Maßstab entsteht, der zeigt, dass auch nicht-euklidische Gradientenabstiegsverfahren (wie \ell_{\infty}-Descent oder Block-CD) eine progressive Schärfung bis zu einem Schwellenwert von $2/\eta$ aufweisen.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics

Die vorgestellte Arbeit führt den sequentiellen Schwellenwert für den Variationskoeffizienten (STCV) ein, einen neuen, datenskalingunabhängigen Regularisierer, der die robuste und zuverlässige Identifikation sparser nichtlinearer Dynamikgesetze aus normalisierten, verrauschten Daten ermöglicht und damit die Schwächen herkömmlicher SINDy-Methoden überwindet.

Jay Raut, Daniel N. Wilke, Stephan Schmidt2026-03-06🤖 cs.LG

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Diese Arbeit stellt einen neuartigen Rahmen vor, der demografische Parität und bedingte demografische Parität durch effiziente Störungen der unbeschränkten optimalen individuellen Entscheidungsregeln in die Schätzung einbindet, um diskriminierende Effekte zu vermeiden, wobei die theoretische Konvergenz und praktische Wirksamkeit durch Simulationen und eine Anwendung auf das Oregon-Gesundheitsversicherungs-Experiment nachgewiesen werden.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Die Autoren schlagen asymmetrische Shapley-Werte als ehrliches Maß zur Bewertung der Bedeutung genomischer Merkmale in klinischen Vorhersagemodellen vor, um die Probleme von Kollinearität und bekannten Kausalrichtungen zu adressieren, und stellen effiziente Algorithmen für lokale und globale Analysen vor, die am Beispiel der Progressions-freien Überlebenszeit bei Darmkrebspatienten veranschaulicht werden.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG