cs.LG papers | Gist.Science

Meta-RL Induces Exploration in Language Agents

Dit paper introduceert LaMer, een Meta-RL-framework dat grote taalmodelagenten in staat stelt om actief te exploreren en zich zonder gradiëntupdates aan te passen aan omgevingsfeedback, wat leidt tot aanzienlijke prestatieverbeteringen en betere generalisatie vergeleken met traditionele RL-baselines.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

Dit paper introduceert Re-Depth Anything, een testtijd-framework dat monokulaire diepsschatting verbetert door foundation modellen te combineren met grote 2D-diffusiemodellen via zelftoezicht op basis van hersynthese van belichting en Shape-from-Shading, zonder labels te vereisen.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Dit artikel introduceert drie complementaire strategieën voor concurrente training van Kolmogorov-Arnold-netwerken (KAN's) op basis van de Newton-Kaczmarz-methode, waaronder een vooraf trainingsprocedure, training op disjuncte datasets en een FPGA-implementatie, om de sequentiële beperkingen van de update-berekening te doorbreken en de convergentie en snelheid aanzienlijk te verbeteren.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Dit paper introduceert Latent Sculpting, een hiërarchisch manifold-leerframework dat door het expliciet structureren van de latent ruimte en het toepassen van een Masked Autoregressive Flow, robuuste zero-shot detectie van out-of-distribution cyberaanvallen mogelijk maakt waar bestaande methoden falen.

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

Dit artikel introduceert FedORA, een methode op basis van primal-dual optimalisatie die het effectief en efficiënt verwijderen van specifieke data of labels mogelijk maakt in verticaal federatief leren, terwijl de modelprestaties behouden blijven en de communicatie- en rekenkosten worden verlaagd.

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Network Traffic Analysis with Process Mining: The UPSIDE Case Study

Dit artikel presenteert een procesmijningsmethode die netwerkbewegingen van online games zoals Clash Royale en Rocket League analyseert door onbewaakte toestandherkenning om interpreteerbare Petri-netten te genereren en het speltype met hoge nauwkeurigheid te classificeren.

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca2026-03-10🤖 cs.LG

Topological Spatial Graph Coarsening

Deze paper introduceert een parameterloze methode voor het coarsenen van ruimtelijke grafen door korte randen in te storten, waarbij een nieuwe 'triangle-aware' filtratie wordt gebruikt om de topologische kenmerken te behouden en de methode invariant is onder rotatie, translatie en schaling.

Anna Calissano, Etienne Lasalle2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

Dit artikel introduceert actor-critic-methoden met robuuste schatters die de eerste niet-triviale garanties bieden voor het leren van een near-optimaal beleid in hoge-dimensionale, schaarse offline versterkingsleer onder sterke data-corruptie en beperkte concentratievoorwaarden.

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Group Cross-Correlations with Faintly Constrained Filters

Dit paper introduceert zwakkere beperkingen voor filters in groepsconvolutie-neurale netwerken die het aantal benodigde knopen verminderen, incompatibiliteiten met niet-compacte stabilisatoren oplossen, en eerdere resultaten generaliseren naar niet-transitieve groepswerkingen en niet-unimodulaire groepen.

Benedikt Fluhr2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

Deze studie introduceert een operationeel veiligheidsgericht evaluatiekader voor stroomnetvoorspelling dat de tekortkomingen van traditionele nauwkeurigheidsmetrieken blootlegt en aantoont dat, hoewel state-space modellen en geavanceerde weather-fusie strategieën de betrouwbaarheid verbeteren, probabilistische kalibratie zonder expliciete bias-beperkingen kan leiden tot onveilige "schijnveiligheid" door systematische overvoorspelling.

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

Dit artikel introduceert een amortized Bayesian inference-framework voor graafdata dat permutatie-invariante encoders combineert met neurale posterior-schattingen om snelle, likelihood-vrije inferentie mogelijk te maken op knoop-, rand- en graf-niveau in diverse domeinen zoals biologie en logistiek.

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench is een door telemetry gedreven benchmark die Large Language Models evalueert op realistische code-aanvullingstaken om ecologische validiteit te waarborgen en bruikbare inzichten te bieden voor modelselectie en -verbetering.

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

Dit artikel biedt het eerste componenten-gebaseerde overzicht van de wederzijdse interactie tussen grote taalmodellen en multi-armed bandits, waarbij wordt onderzocht hoe deze technologieën elkaar wederzijds verbeteren in zowel besluitvorming als taalverwerking.

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

Het artikel introduceert ELSA, een nieuw framework dat split learning en hiërarchische federatie combineert om privacybewuste en efficiënte fine-tuning van grote taalmodellen op het netwerk-edge mogelijk te maken ondanks beperkte bronnen en data-heterogeniteit.

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Dit artikel introduceert een nieuwe, dataratesbewuste architectuur voor CNN-inferentie op FPGA's die door slimme signaleninterleaving en hardware-delen een hoge hardwarebenutting en doorvoer garandeert, zelfs bij lagen met datareductie zoals pooling en convolutie met stride.

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

Dit paper introduceert MeanCache, een trainingsvrij caching-framework dat Flow Matching-inferentie versnelt door in plaats van momentane snelheid gemiddelde snelheden te gebruiken via Jacobiaan-vectorproducten, wat leidt tot aanzienlijke versnelling (tot 4,56x) en verbeterde kwaliteitsbehoud bij generatieve modellen zoals FLUX.1 en HunyuanVideo.

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

PASS: Certified Subset Repair for Classical and Quantum Pairwise Constrained Clustering

PASS is een schaalbaar framework voor k-means clustering met paarsgewijze constraints dat optimalisatie concentreert op een klein werksubsets, waardoor het zowel klassieke als quantum-benaderingen efficiënter maakt en verifieerbare oplossingen biedt voor onmogelijke constraintsets.

Pedro Chumpitaz-Flores, My Duong, Ying Mao, Kaixun Hua2026-03-10🤖 cs.LG

Model-Free Neural State Estimation in Nonlinear Dynamical Systems: Comparing Neural and Classical Filters

Deze studie toont aan dat modelvrije neurale netwerken, met name state-space-modellen, in niet-lineaire dynamische systemen een schatting van de toestand kunnen leveren die vergelijkbaar is met sterke klassieke filters, terwijl ze tegelijkertijd een aanzienlijk hogere doorvoersnelheid bereiken zonder toegang te hebben tot de onderliggende systeemvergelijkingen.

Zhuochen Liu, Hans Walker, Rahul Jain2026-03-10🤖 cs.LG

TimeSliver : Symbolic-Linear Decomposition for Explainable Time Series Classification

Dit paper introduceert TimeSliver, een nieuw interpreteerbaar deep learning-framework dat door het combineren van ruwe tijdsreeksdata met symbolische abstractie de bijdrage van elke tijdssegment aan de voorspelling lineair encodeert, waardoor het zowel de interpretatieverbetering als de voorspellende prestaties van bestaande methoden voor tijdsreeksclassificatie overtreft.

Akash Pandey, Payal Mohapatra, Wei Chen, Qi Zhu, Sinan Keten2026-03-10🤖 cs.LG

Transferable Graph Condensation from the Causal Perspective

Deze paper introduceert TGCC, een nieuwe methode voor grafcondensatie die op causaliteit gebaseerde, domein-invariante kenmerken gebruikt om effectieve en overdraagbare gecomprimeerde datasets te creëren die de prestaties in complexe cross-task en cross-domein scenario's aanzienlijk verbeteren.

Huaming Du, Yijie Huang, Su Yao, Yiying Wang, Yueyang Zhou, Jingwen Yang, Jinshi Zhang, Han Ji, Yu Zhao, Guisong Liu, Hegui Zhang, Carl Yang, Gang Kou2026-03-10🤖 cs.LG

← Vorige Volgende →