cs.LG Arbeiten | Gist.Science

RoboMorph: Evolving Robot Morphology using Large Language Models

Die Arbeit stellt RoboMorph vor, einen automatisierten Ansatz, der große Sprachmodelle in Kombination mit evolutionären Algorithmen nutzt, um effizient modulare Roboterdesigns zu generieren und zu optimieren, die in verschiedenen Geländetypen mit oder besser als bisherige Methoden abschneiden.

Kevin Qiu, Władysław Pałucki, Krzysztof Ciebiera, Paweł Fijałkowski, Marek Cygan, Łukasz Kucinski2026-03-24🤖 cs.LG

Finite Neural Networks as Mixtures of Gaussian Processes: From Provable Error Bounds to Prior Selection

Diese Arbeit stellt einen algorithmischen Rahmen vor, der endliche neuronale Netze durch Mischungen aus Gauß-Prozessen mit nachweisbaren Fehlergrenzen approximiert und somit eine präzise Unsicherheitsquantifizierung sowie die Anpassung von Netzwerkkonfigurationen an gewünschte Gauß-Prozess-Verhalten ermöglicht.

Steven Adams, Andrea Patanè, Morteza Lahijanian, Luca Laurenti2026-03-24📊 stat

Fast convergence of a Federated Expectation-Maximization Algorithm

Die Arbeit zeigt, dass der federierte Expectation-Maximization-Algorithmus für Mischungen linearer Regressionen unter bestimmten Signal-Rausch-Verhältnissen in allen Regimen konvergiert und dabei Datenheterogenität nicht als Hindernis, sondern als Beschleuniger der Konvergenz fungiert.

Zhixu Tao, Rajita Chandak, Sanjeev Kulkarni2026-03-24📊 stat

Strongly-polynomial time and validation analysis of policy gradient methods

Diese Arbeit führt mit der „Advantage Gap Function" ein neuartiges Abbruchkriterium für Policy-Gradient-Methoden ein, das es ermöglicht, Markov-Entscheidungsprozesse in stark polynomieller Zeit zu lösen und im stochastischen Fall eine berechenbare Validierung der Optimalität ohne externe Vergleiche zu gewährleisten.

Caleb Ju, Guanghui Lan2026-03-24🤖 cs.LG

Multilevel Picard approximations and deep neural networks with ReLU, leaky ReLU, and softplus activation overcome the curse of dimensionality when approximating semilinear parabolic partial differential equations in $L^p$ -sense

Die Arbeit zeigt, dass Multilevel-Picard-Approximationen und tiefe neuronale Netze mit ReLU-, leaky-ReLU- und Softplus-Aktivierungsfunktionen semilineare parabolische partielle Differentialgleichungen in der $L^p$ -Norm ohne den Fluch der Dimensionalität approximieren können, wobei sich der Rechenaufwand und die Anzahl der Parameter höchstens polynomial in der Dimension und dem Kehrwert der Genauigkeit verhalten.

Ariel Neufeld, Tuan Anh Nguyen2026-03-24🤖 cs.LG

Meta-Transfer Learning Powered Temporal Graph Networks for Cross-City Real Estate Appraisal

Die Studie stellt MetaTransfer vor, ein Meta-Transfer-Learning-Framework mit temporalen Graphennetzwerken, das durch die Übertragung von Wissen aus datenreichen Metropolen auf datenarme Städte die Genauigkeit der Immobilienbewertung verbessert.

Weijia Zhang, Jindong Han, Hao Liu, Wei Fan, Hao Wang, Hui Xiong2026-03-24🤖 cs.LG

Variance reduction combining pre-experiment and in-experiment data

Diese Arbeit stellt ein robustes und skalierbares Framework vor, das Vor- und In-Experiment-Daten kombiniert, um die Varianz von ATE-Schätzern in Online-A/B-Tests zu reduzieren und so die Sensitivität von Experimenten bei Etsy nachweislich zu verbessern.

Zhexiao Lin, Pablo Crespo2026-03-24📈 econ

Sliding Puzzles Gym: A Scalable Benchmark for State Representation in Visual Reinforcement Learning

Die Arbeit stellt das skalierbare Benchmark-System „Sliding Puzzles Gym" (SPGym) vor, das es ermöglicht, die Herausforderungen des visuellen Repräsentationslernens in der Verstärkungslernung systematisch zu isolieren und zu untersuchen, wobei Experimente zeigen, dass aktuelle Algorithmen bei zunehmender visueller Vielfalt versagen und oft einfachere Methoden wie Daten-Augmentierung überlegen sind.

Bryan L. M. de Oliveira, Luana G. B. Martins, Bruno Brandão, Murilo L. da Luz, Telma W. de L. Soares, Luckeciano C. Melo2026-03-24🤖 cs.LG

Dirichlet process mixtures of block $g$ priors for model selection and prediction in linear models

Diese Arbeit stellt Dirichlet-Prozess-Mischungen aus Block- $g$ -Priors für die Modellauswahl und Vorhersage in linearen Modellen vor, die eine konsistente, korrelationsberücksichtigende Schätzung ermöglichen, das Lindley-Paradoxon vermeiden und in Simulationen sowie realen Daten eine hohe Entdeckungswahrscheinlichkeit bei geringen Fehlalarmen bieten.

Anupreet Porwal, Abel Rodriguez2026-03-24📊 stat

The GECo algorithm for Graph Neural Networks Explanation

Die Arbeit stellt GECo vor, einen neuen Algorithmus zur Erklärbarkeit von Graph Neural Networks, der durch die Analyse von Graph-Communities die Klassifikationsergebnisse interpretiert und dabei in Tests gegenüber bestehenden Methoden überlegen abschneidet.

Salvatore Calderaro, Domenico Amato, Giosuè Lo Bosco, Riccardo Rizzo, Filippo Vella2026-03-24🤖 cs.AI

← Zurück Weiter →

cs.LG