cs.LG papers | Gist.Science

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

Dit paper introduceert GoRL, een framework dat de stabiliteit en expressiviteit van online versterkend leren verbetert door optimalisatie te ontkoppelen van generatie via een tractabele latente ruimte en een conditionele generatieve decoder, wat leidt tot superieure prestaties op complexe controle-taken.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Dit artikel introduceert Sparse Isotonic Shapley Regression (SISR), een geünificeerd raamwerk dat monotoon transformatie en sparsiteit combineert om de beperkingen van traditionele Shapley-waarden bij niet-lineaire afhankelijkheden en hoge dimensionaliteit te overwinnen en zo nauwkeurigere, stabielere en efficiëntere verklaringen voor AI-modellen te bieden.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Dit paper introduceert een tweestaps generatief data-augmentatieframework dat regelgebaseerde maskervervorming combineert met GAN-gebaseerde beeld-naar-beeld vertaling om effectieve gemaskerde gezichtsdetectie en -herkenning mogelijk te maken met een zeer kleine dataset, terwijl het ook de beperkte academische en financiële omstandigheden achter de totstandkoming van het werk belicht.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

Dit artikel introduceert SALVE, een unificerend raamwerk dat mechanische interpreteerbaarheid en modelbewerking combineert door middel van een sparse autoencoder en Grad-FAM om neurale netwerken te ontdekken, valideren en permanent te controleren via precisie-ingrepen in de gewichtenruimte.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

Dit paper introduceert LaMer, een Meta-RL-framework dat grote taalmodelagenten in staat stelt om actief te exploreren en zich zonder gradiëntupdates aan te passen aan omgevingsfeedback, wat leidt tot aanzienlijke prestatieverbeteringen en betere generalisatie vergeleken met traditionele RL-baselines.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

Dit paper introduceert Re-Depth Anything, een testtijd-framework dat monokulaire diepsschatting verbetert door foundation modellen te combineren met grote 2D-diffusiemodellen via zelftoezicht op basis van hersynthese van belichting en Shape-from-Shading, zonder labels te vereisen.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Dit artikel introduceert drie complementaire strategieën voor concurrente training van Kolmogorov-Arnold-netwerken (KAN's) op basis van de Newton-Kaczmarz-methode, waaronder een vooraf trainingsprocedure, training op disjuncte datasets en een FPGA-implementatie, om de sequentiële beperkingen van de update-berekening te doorbreken en de convergentie en snelheid aanzienlijk te verbeteren.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Dit paper introduceert Latent Sculpting, een hiërarchisch manifold-leerframework dat door het expliciet structureren van de latent ruimte en het toepassen van een Masked Autoregressive Flow, robuuste zero-shot detectie van out-of-distribution cyberaanvallen mogelijk maakt waar bestaande methoden falen.

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

Dit artikel introduceert FedORA, een methode op basis van primal-dual optimalisatie die het effectief en efficiënt verwijderen van specifieke data of labels mogelijk maakt in verticaal federatief leren, terwijl de modelprestaties behouden blijven en de communicatie- en rekenkosten worden verlaagd.

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Network Traffic Analysis with Process Mining: The UPSIDE Case Study

Dit artikel presenteert een procesmijningsmethode die netwerkbewegingen van online games zoals Clash Royale en Rocket League analyseert door onbewaakte toestandherkenning om interpreteerbare Petri-netten te genereren en het speltype met hoge nauwkeurigheid te classificeren.

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca2026-03-10🤖 cs.LG

Topological Spatial Graph Coarsening

Deze paper introduceert een parameterloze methode voor het coarsenen van ruimtelijke grafen door korte randen in te storten, waarbij een nieuwe 'triangle-aware' filtratie wordt gebruikt om de topologische kenmerken te behouden en de methode invariant is onder rotatie, translatie en schaling.

Anna Calissano, Etienne Lasalle2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

Dit artikel introduceert actor-critic-methoden met robuuste schatters die de eerste niet-triviale garanties bieden voor het leren van een near-optimaal beleid in hoge-dimensionale, schaarse offline versterkingsleer onder sterke data-corruptie en beperkte concentratievoorwaarden.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Group Cross-Correlations with Faintly Constrained Filters

Dit paper introduceert zwakkere beperkingen voor filters in groepsconvolutie-neurale netwerken die het aantal benodigde knopen verminderen, incompatibiliteiten met niet-compacte stabilisatoren oplossen, en eerdere resultaten generaliseren naar niet-transitieve groepswerkingen en niet-unimodulaire groepen.

Benedikt Fluhr2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

Deze studie introduceert een operationeel veiligheidsgericht evaluatiekader voor stroomnetvoorspelling dat de tekortkomingen van traditionele nauwkeurigheidsmetrieken blootlegt en aantoont dat, hoewel state-space modellen en geavanceerde weather-fusie strategieën de betrouwbaarheid verbeteren, probabilistische kalibratie zonder expliciete bias-beperkingen kan leiden tot onveilige "schijnveiligheid" door systematische overvoorspelling.

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Dit artikel introduceert een amortized Bayesian inference-framework voor graafdata dat permutatie-invariante encoders combineert met neurale posterior-schattingen om snelle, likelihood-vrije inferentie mogelijk te maken op knoop-, rand- en graf-niveau in diverse domeinen zoals biologie en logistiek.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench is een door telemetry gedreven benchmark die Large Language Models evalueert op realistische code-aanvullingstaken om ecologische validiteit te waarborgen en bruikbare inzichten te bieden voor modelselectie en -verbetering.

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

Dit artikel biedt het eerste componenten-gebaseerde overzicht van de wederzijdse interactie tussen grote taalmodellen en multi-armed bandits, waarbij wordt onderzocht hoe deze technologieën elkaar wederzijds verbeteren in zowel besluitvorming als taalverwerking.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

Het artikel introduceert ELSA, een nieuw framework dat split learning en hiërarchische federatie combineert om privacybewuste en efficiënte fine-tuning van grote taalmodellen op het netwerk-edge mogelijk te maken ondanks beperkte bronnen en data-heterogeniteit.

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Dit artikel introduceert een nieuwe, dataratesbewuste architectuur voor CNN-inferentie op FPGA's die door slimme signaleninterleaving en hardware-delen een hoge hardwarebenutting en doorvoer garandeert, zelfs bij lagen met datareductie zoals pooling en convolutie met stride.

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

Dit paper introduceert MeanCache, een trainingsvrij caching-framework dat Flow Matching-inferentie versnelt door in plaats van momentane snelheid gemiddelde snelheden te gebruiken via Jacobiaan-vectorproducten, wat leidt tot aanzienlijke versnelling (tot 4,56x) en verbeterde kwaliteitsbehoud bij generatieve modellen zoals FLUX.1 en HunyuanVideo.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

← Vorige Volgende →