cs.LG Arbeiten | Gist.Science

World Model for Battery Degradation Prediction Under Non-Stationary Aging

Diese Arbeit formuliert die Vorhersage des Batteriealterungsverlaufs als Weltmodellproblem, das durch die Propagierung latenter Zustände und die Einbeziehung eines Single-Particle-Modell-Constraints die Genauigkeit der Degradationsprognose, insbesondere im kritischen „Knie"-Bereich, im Vergleich zu direkten Regressionsansätzen signifikant verbessert.

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Diese Arbeit stellt ein Multi-Agenten-Reinforcement-Learning-Framework vor, das auf dem Proximal Policy Optimization-Algorithmus basiert, um Drohnenschwärme für die dynamische und priorisierte Lieferung medizinischer Güter in unsicheren Umgebungen zu koordinieren.

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Die Arbeit stellt GR³ (Group Relative Reward Rescaling) vor, einen neuen Ansatz für das Reinforcement Learning, der durch eine multiplikative Belohnungsanpassung und regularisierte Kalibrierung die problematische Längeninflation von Sprachmodellen effektiv eindämmt, ohne dabei die Trainingsdynamik oder die Leistungsfähigkeit zu beeinträchtigen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Die Arbeit stellt SCORE vor, eine ressourceneffiziente Alternative zum klassischen Schichtstapel, die durch wiederholte Anwendung eines einzigen geteilten neuronalen Blocks mit einem kontraktiven ODE-inspirierten Update-Verfahren die Konvergenzgeschwindigkeit verbessert und die Parameteranzahl reduziert.

Guillaume Godin2026-03-12🤖 cs.LG

Learning to Score: Tuning Cluster Schedulers through Reinforcement Learning

Diese Arbeit stellt einen Reinforcement-Learning-Ansatz vor, der durch das adaptive Lernen von Gewichten für Cluster-Scheduler-Funktionen die End-to-End-Leistung von Jobs im Vergleich zu festen Gewichten und bestehenden Baselines signifikant verbessert.

Martin Asenov, Qiwen Deng, Gingfung Yeung, Adam Barker2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Diese Studie nutzt einen gerichteten bipartiten Graphen innerhalb eines maschinellen Lernrahmens, um die Vorhersagbarkeit von Aktienrenditen zwischen den US- und chinesischen Märkten zu analysieren, und zeigt dabei eine ausgeprägte Asymmetrie auf, bei der US-Renditen signifikante Informationen für chinesische Intraday-Renditen liefern, während der umgekehrte Effekt begrenzt ist.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Quantization Robustness of Monotone Operator Equilibrium Networks

Die Arbeit analysiert die Robustheit von Monotone Operator Equilibrium Networks gegenüber Gewichtsquantisierung, zeigt, dass die Konvergenz garantiert bleibt, solange die spektrale Störung kleiner als der Monotonie-Margin ist, und demonstriert experimentell, dass eine quantisierungsbewusste Training diese Konvergenzgarantien selbst bei vier Bit wiederherstellen kann.

James Li, Philip H. W. Leong, Thomas Chaffey2026-03-12⚡ eess

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

Diese Arbeit stellt einen Riemannischen Geometie-erhaltenden Variational Autoencoder (RGP-VAE) vor, der synthetische, symmetrisch positiv definite EEG-Kovarianzmatrizen für Motor-Imagery-BCI-Anwendungen generiert, um die Datenverfügbarkeit zu erhöhen und einen subjektsunabhängigen latenten Raum zu lernen.

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

Die Studie zeigt, dass Transformer-Modelle durch In-Context-Learning keine einfache Ähnlichkeitsprüfung durchführen, sondern statistische Schätzer konstruieren, die durch eine logistische Analyse als Approximation optimaler Likelihood-Ratio-Tests identifiziert werden können.

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

HAPEns: Hardware-Aware Post-Hoc Ensembling for Tabular Data

Die Arbeit stellt HAPEns vor, eine hardwarebewusste Nachträglich-Ensemble-Methode für Tabellendaten, die durch die Optimierung entlang der Pareto-Front von Vorhersagegenauigkeit und Ressourcennutzung überlegene Kompromisse zwischen Leistung und Bereitstellungskosten im Vergleich zu bestehenden Baselines erreicht.

Jannis Maier, Lennart Purucker2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Diese empirische Studie widerlegt die Hypothese, dass Ausrichtungsaufgaben für Large Language Models zwingend diversitätsfördernde Algorithmen benötigen, und zeigt, dass konventionelle, belohnungsmaximierende RLVR-Methoden auch für das moralische Reasoning effektiv sind, da sich hochbewertete Antworten in diesem Bereich in einem konzentrierten semantischen Raum befinden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Diese Arbeit stellt den theoretischen Rahmen „Gradient Flow Drifting" vor, der Drifting-Modelle als Wasserstein-Gradientenflüsse von KDE-approximierten Divergenzen identifiziert und durch eine gemischte Divergenzstrategie sowie eine Erweiterung auf Riemannsche Mannigfaltigkeiten sowohl Modenkollaps als auch -verwischung vermeidet.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Dieser technische Bericht dokumentiert eine JAX-kompatible Implementierung der selbstskalierten Broyden-Familie von Quasi-Newton-Verfahren (einschließlich BFGS, DFP und Broyden mit ihren selbstskalierten Varianten) auf Basis der Optimistix-Bibliothek, um deren Nutzung in der JAX-Community zu erleichtern.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Die Arbeit stellt Geo-ATBench, einen neuen Benchmark für geospatiales Audio-Tagging, und das Framework GeoFusion-AT vor, um nachzuweisen, dass die Integration geospatialer semantischer Kontexte die Mehrklassen-Erkennung von Umgebungsgeräuschen, insbesondere bei akustisch ähnlichen Ereignissen, signifikant verbessert.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

Die vorgestellte Arbeit stellt die Conditional Expectation Reward (CER) vor, eine Methode, die ein Large Language Model als impliziten Verifizierer nutzt, um durch weiche, graduierte Belohnungssignale das Reinforcement Learning für allgemeine Denkprozesse ohne externe Verifizierer zu ermöglichen.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Diese Arbeit stellt einen neuartigen, erklärbaren Ansatz vor, der auf aktiven Pfaden in neuronalen Netzen basiert, um Backdoor-Auslöser in Intrusion-Detection-Systemen zu erkennen und zu eliminieren.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Die Arbeit stellt FAME vor, eine neue Methode zur Erzeugung formaler abduktiver Minimalerklärungen für große neuronale Netze, die durch dedizierte Perturbationsdomänen und LiRPA-Bound-Techniken sowohl die Erklärungsgröße als auch die Laufzeit im Vergleich zu bestehenden Ansätzen wie VERIX+ signifikant verbessert.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Die Arbeit stellt ein erklärbares, unüberwachtes STA-GNN-Modell für die Anomalieerkennung in industriellen Steuerungssystemen vor, das räumlich-zeitliche Abhängigkeiten nutzt, um durch Aufmerksamkeitsmechanismen kausale Zusammenhänge zu identifizieren und durch konforme Vorhersage die Zuverlässigkeit bei sich ändernden Umgebungen sicherzustellen.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Diese Studie demonstriert, dass ein datengetriebener Ansatz, der die Singulärwertzerlegung mit dem neuronalen Netzwerk SHRED kombiniert, in der Lage ist, den vollständigen magnetohydrodynamischen Zustand in Fusionsreaktoren aus wenigen Temperatursensoren effizient und robust zu rekonstruieren, was eine kostengünstige Echtzeit-Überwachung ermöglicht.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Die Arbeit stellt „Contract And Conquer" (CAC) vor, eine Methode zur provablen Berechnung von adversariellen Beispielen für Black-Box-Modelle durch Wissensdistillation und Kontraktion des Suchraums, die nachweislich innerhalb einer festen Anzahl von Iterationen erfolgreich ist und auf dem ImageNet-Datensatz den aktuellen Stand der Technik übertrifft.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

← Zurück Weiter →