cs.LG papers | Gist.Science

Tackling Length Inflation Without Trade-offs: Group Relative Reward Rescaling for Reinforcement Learning

Dit artikel introduceert Group Relative Reward Rescaling (GR³), een methode die lengte-inflatie in versterkingslerende taalmodellen effectief tegengaat zonder prestatie-inlevering door het probleem te herformuleren als een multiplicatief herschalingsschema in plaats van additieve straffen.

Zichao Li, Jie Lou, Fangchen Dong, Zhiyuan Fan, Mengjie Ren, Hongyu Lin, Xianpei Han, Debing Zhang, Le Sun, Yaojie Lu, Xing Yu2026-03-12🤖 cs.LG

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Het paper introduceert SCORE, een efficiënt alternatief voor klassieke laagstapeling dat door het herhaald toepassen van een gedeeld neuronaal blok met contractieve ODE-geïnspireerde updates, de convergentie versnelt en het parameteraantal verlaagt zonder ingewikkelde ODE-oplossers.

Guillaume Godin2026-03-12✓ Author reviewed ⓘ🤖 cs.LG

Learning to Score: Tuning Cluster Schedulers through Reinforcement Learning

Dit paper introduceert een versterkingsleringsbenadering om de wegingen van clusterplanners dynamisch aan te passen, wat leidt tot een aanzienlijke verbetering van de eind-tot-eind prestaties van taken in vergelijking met statische of handmatig getuneerde methoden.

Martin Asenov, Qiwen Deng, Gingfung Yeung, Adam Barker2026-03-12🤖 cs.LG

A Bipartite Graph Approach to U.S.-China Cross-Market Return Forecasting

Dit artikel presenteert een machine learning-framework dat een gerichte bipartiete grafiek gebruikt om de voorspellende asymmetrie tussen de Amerikaanse en Chinese aandelenmarkten te onthullen, waarbij Amerikaanse slotkoersen sterke voorspellende waarde blijken te hebben voor Chinese intraday-returns, terwijl het omgekeerde effect beperkt is.

Jing Liu, Maria Grith, Xiaowen Dong, Mihai Cucuringu2026-03-12💰 q-fin

Quantization Robustness of Monotone Operator Equilibrium Networks

Dit artikel analyseert de kwantisatierobuustheid van Monotone Operator Equilibrium Networks en toont aan dat convergentie gegarandeerd blijft zolang de spectrale verstoring kleiner is dan de monotonie-marge, waarbij experimenten op MNIST een overgangspunt bevestigen en kwantisatiebewuste training vier-bits convergentie herstelt.

James Li, Philip H. W. Leong, Thomas Chaffey2026-03-12⚡ eess

Riemannian Geometry-Preserving Variational Autoencoder for MI-BCI Data Augmentation

Dit artikel introduceert een Riemanniaanse meetkunde-bewarende variatie-auto-encoder (RGP-VAE) die hoogwaardige synthetische EEG-covariantiematrices genereert voor motorbeelding-BCI-toepassingen, waarbij de symmetrisch positief-definiëerde aard van de data behouden blijft en een subject-onafhankelijke latente ruimte wordt geleerd.

Viktorija Polaka, Ivo Pascal de Jong, Andreea Ioana Sburlea2026-03-12🤖 cs.LG

Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

Dit paper toont aan dat Transformers via in-context learning niet alleen op basis van eenvoudige overeenkomstigheid werken, maar in feite Bayes-optimale statistische schatters construeren die de likelihood-ratio test benaderen door taakadaptieve algoritmes te implementeren.

Faris Chaudhry, Siddhant Gadkari2026-03-12🤖 cs.LG

HAPEns: Hardware-Aware Post-Hoc Ensembling for Tabular Data

Dit paper introduceert HAPEns, een post-hoc ensemble-methode voor tabulaire data die een evenwicht zoekt tussen voorspellende nauwkeurigheid en hardware-efficiëntie door een diverse set van ensemble-oplossingen langs de Pareto-front te construeren, wat resulteert in superieure prestaties vergeleken met bestaande methoden.

Jannis Maier, Lennart Purucker2026-03-12🤖 cs.LG

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Deze empirische studie toont aan dat LLM-afstemming op morele redenering geen diversiteitsbevorderende algoritmen vereist, omdat standaard RLVR-methode voor beloningsmaximalisatie even effectief zijn dankzij de geconcentreerde aard van hoogwaardige morele antwoorden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Dit paper introduceert het 'Gradient Flow Drifting'-framework, dat wiskundig aantoont dat het recente Drifting-model equivalent is aan een Wasserstijn-gradiëntstroom voor de forward KL-divergentie onder KDE-approximatie, en biedt een theoretisch onderbouwde strategie voor het combineren van divergenties om zowel modusinstorting als modusvervaging te voorkomen.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Dit technische artikel beschrijft een JAX-implementatie van de Self-Scaled Broyden-familie van quasi-Newton-methoden, inclusief BFGS, DFP en hun zelfgeschaalde varianten, die volledig compatibel is met de Optimistix-optimalisatiebibliotheek om de adoptie binnen de JAX-gemeenschap te vergemakkelijken.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Dit paper introduceert Geo-ATBench, een benchmark en het GeoFusion-AT-framework voor geospatiale audiotagging, die aantonen dat het integreren van geografische semantische context de nauwkeurigheid van geluherkenning verbetert, vooral bij akoestisch vergelijkbare gebeurtenissen.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

Dit artikel introduceert Conditional Expectation Reward (CER), een methode die grote taalmodellen gebruikt als impliciete verifiers om versterkingslering met verifieerbare beloningen uit te breiden naar domeinen met vrije antwoorden door een zachte, graduele beloning te bieden op basis van de waarschijnlijkheid van het genereren van een referentieantwoord.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Dit paper presenteert een nieuwe, verklaarbare aanpak om neurale netwerk-backdoors te detecteren en te elimineren door middel van actieve paden, met succesvolle experimenten in het domein van inbraakdetectie.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Dit paper introduceert FAME, een nieuwe methode voor formele abstracte minimale verklaringen van neurale netwerken die via geavanceerde perturbatiedomeinen en LiRPA-bounds schaalbaar is naar grote netwerken terwijl het de grootte van de verklaringen verkleint en de kwaliteit kwantificeert.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Dit paper introduceert een STA-GNN-model voor onbewaakte en verklaarbare anomaliedetectie in industriële besturingssystemen, dat ruimtelijk-temporele afhankelijkheden leert, drift en valse alarmen aanpakt via conformale voorspelling, en meerdere datamodi combineert voor betrouwbare cyber-fysieke beveiliging.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Dit artikel presenteert een data-gedreven framework dat Singular Value Decomposition combineert met SHRED-neurale netwerken om de volledige magnetohydrodynamische toestand van fusie-relevante systemen nauwkeurig en efficiënt te reconstrueren op basis van slechts drie temperatuursensoren, zelfs voor niet-getrainde magnetische veldintensiteiten.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Dit paper introduceert Contract And Conquer (CAC), een methode die via kennisdistillatie en een bewezen overdraagbaarheidsgarantie het zoekruimte voor adversariële voorbeelden in een black-box model contracteert om zo binnen een vast aantal iteraties een gegarandeerd adversariaal voorbeeld te vinden.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Dit paper introduceert EvoSchema, een uitgebreid benchmarkkader dat een nieuwe taxonomie van schema-evoluties gebruikt om de robuustheid van text-to-SQL-systemen te evalueren en te verbeteren tegenover dynamische veranderingen in databaseschema's.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

Dit paper introduceert Riemannian MeanFlow, een methode die Flow Matching uitbreidt naar Riemanniaanse variëteiten om hoogwaardige generatie in één stap mogelijk te maken door parallel transport en log-kaarten te gebruiken om de noodzaak van numerieke integratie te elimineren.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

← Vorige Volgende →