cs.LG papers | Gist.Science

World Model for Battery Degradation Prediction Under Non-Stationary Aging

Dit artikel introduceert een wereldmodel voor het voorspellen van de degradatie van lithium-ionbatterijen onder niet-stationaire omstandigheden, waarbij het gebruik van een latentetoestand en een geleerde dynamiek de voorspelling van de gezondheidstoestand over de toekomstige cycli significant verbetert ten opzichte van directe regressie, met name wanneer een Single Particle Model-beperking wordt toegepast om de nauwkeurigheid bij de degradatieknie te verhogen.

Kai Chin Lim, Khay Wai See2026-03-12⚡ eess

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Dit artikel presenteert een multi-agent reinforcement learning-framework dat gebruikmaakt van Proximal Policy Optimization om UAV-vloten te coördineren voor tijdskritieke medische leveringen in dynamische omgevingen, waarbij experimenten met real-world data aantonen dat klassieke PPO-uitvoeringen superieure prestaties leveren ten opzichte van asynchrone en sequentiële strategieën.

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Dit artikel introduceert Group Relative Reward Rescaling (GR³), een methode die lengte-inflatie in versterkingslerende taalmodellen effectief tegengaat zonder prestatie-inlevering door het probleem te herformuleren als een multiplicatief herschalingsschema in plaats van additieve straffen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Het paper introduceert SCORE, een efficiënt alternatief voor klassieke laagstapeling dat door het herhaald toepassen van een gedeeld neuronaal blok met contractieve ODE-geïnspireerde updates, de convergentie versnelt en het parameteraantal verlaagt zonder ingewikkelde ODE-oplossers.

Guillaume Godin2026-03-12🤖 cs.LG

Learning to Score: Tuning Cluster Schedulers through Reinforcement Learning

Dit paper introduceert een versterkingsleringsbenadering om de wegingen van clusterplanners dynamisch aan te passen, wat leidt tot een aanzienlijke verbetering van de eind-tot-eind prestaties van taken in vergelijking met statische of handmatig getuneerde methoden.

Martin Asenov, Qiwen Deng, Gingfung Yeung, Adam Barker2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Dit artikel presenteert een machine learning-framework dat een gerichte bipartiete grafiek gebruikt om de voorspellende asymmetrie tussen de Amerikaanse en Chinese aandelenmarkten te onthullen, waarbij Amerikaanse slotkoersen sterke voorspellende waarde blijken te hebben voor Chinese intraday-returns, terwijl het omgekeerde effect beperkt is.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Quantization Robustness of Monotone Operator Equilibrium Networks

Dit artikel analyseert de kwantisatierobuustheid van Monotone Operator Equilibrium Networks en toont aan dat convergentie gegarandeerd blijft zolang de spectrale verstoring kleiner is dan de monotonie-marge, waarbij experimenten op MNIST een overgangspunt bevestigen en kwantisatiebewuste training vier-bits convergentie herstelt.

James Li, Philip H. W. Leong, Thomas Chaffey2026-03-12⚡ eess

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

Dit artikel introduceert een Riemanniaanse meetkunde-bewarende variatie-auto-encoder (RGP-VAE) die hoogwaardige synthetische EEG-covariantiematrices genereert voor motorbeelding-BCI-toepassingen, waarbij de symmetrisch positief-definiëerde aard van de data behouden blijft en een subject-onafhankelijke latente ruimte wordt geleerd.

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

Dit paper toont aan dat Transformers via in-context learning niet alleen op basis van eenvoudige overeenkomstigheid werken, maar in feite Bayes-optimale statistische schatters construeren die de likelihood-ratio test benaderen door taakadaptieve algoritmes te implementeren.

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

HAPEns: Hardware-Aware Post-Hoc Ensembling for Tabular Data

Dit paper introduceert HAPEns, een post-hoc ensemble-methode voor tabulaire data die een evenwicht zoekt tussen voorspellende nauwkeurigheid en hardware-efficiëntie door een diverse set van ensemble-oplossingen langs de Pareto-front te construeren, wat resulteert in superieure prestaties vergeleken met bestaande methoden.

Jannis Maier, Lennart Purucker2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Deze empirische studie toont aan dat LLM-afstemming op morele redenering geen diversiteitsbevorderende algoritmen vereist, omdat standaard RLVR-methode voor beloningsmaximalisatie even effectief zijn dankzij de geconcentreerde aard van hoogwaardige morele antwoorden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Dit paper introduceert het 'Gradient Flow Drifting'-framework, dat wiskundig aantoont dat het recente Drifting-model equivalent is aan een Wasserstijn-gradiëntstroom voor de forward KL-divergentie onder KDE-approximatie, en biedt een theoretisch onderbouwde strategie voor het combineren van divergenties om zowel modusinstorting als modusvervaging te voorkomen.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Dit technische artikel beschrijft een JAX-implementatie van de Self-Scaled Broyden-familie van quasi-Newton-methoden, inclusief BFGS, DFP en hun zelfgeschaalde varianten, die volledig compatibel is met de Optimistix-optimalisatiebibliotheek om de adoptie binnen de JAX-gemeenschap te vergemakkelijken.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Dit paper introduceert Geo-ATBench, een benchmark en het GeoFusion-AT-framework voor geospatiale audiotagging, die aantonen dat het integreren van geografische semantische context de nauwkeurigheid van geluherkenning verbetert, vooral bij akoestisch vergelijkbare gebeurtenissen.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

Dit artikel introduceert Conditional Expectation Reward (CER), een methode die grote taalmodellen gebruikt als impliciete verifiers om versterkingslering met verifieerbare beloningen uit te breiden naar domeinen met vrije antwoorden door een zachte, graduele beloning te bieden op basis van de waarschijnlijkheid van het genereren van een referentieantwoord.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Dit paper presenteert een nieuwe, verklaarbare aanpak om neurale netwerk-backdoors te detecteren en te elimineren door middel van actieve paden, met succesvolle experimenten in het domein van inbraakdetectie.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Dit paper introduceert FAME, een nieuwe methode voor formele abstracte minimale verklaringen van neurale netwerken die via geavanceerde perturbatiedomeinen en LiRPA-bounds schaalbaar is naar grote netwerken terwijl het de grootte van de verklaringen verkleint en de kwaliteit kwantificeert.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Dit paper introduceert een STA-GNN-model voor onbewaakte en verklaarbare anomaliedetectie in industriële besturingssystemen, dat ruimtelijk-temporele afhankelijkheden leert, drift en valse alarmen aanpakt via conformale voorspelling, en meerdere datamodi combineert voor betrouwbare cyber-fysieke beveiliging.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Dit artikel presenteert een data-gedreven framework dat Singular Value Decomposition combineert met SHRED-neurale netwerken om de volledige magnetohydrodynamische toestand van fusie-relevante systemen nauwkeurig en efficiënt te reconstrueren op basis van slechts drie temperatuursensoren, zelfs voor niet-getrainde magnetische veldintensiteiten.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Dit paper introduceert Contract And Conquer (CAC), een methode die via kennisdistillatie en een bewezen overdraagbaarheidsgarantie het zoekruimte voor adversariële voorbeelden in een black-box model contracteert om zo binnen een vast aantal iteraties een gegarandeerd adversariaal voorbeeld te vinden.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

← Vorige Volgende →