cs.LG papers | Gist.Science

LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks

Het artikel introduceert LoRA-Ensemble, een parameter-efficiënte methode voor zelfattentie-netwerken die via Low-Rank Adaptatie een impliciete ensemble vormt die niet alleen de nauwkeurigheid van expliciete ensembles evenaart of overtreft, maar ook superieure kalibratie biedt.

Dominik J. Mühlematter, Michelle Halbheer, Alexander Becker, Dominik Narnhofer, Helge Aasen, Konrad Schindler, Mehmet Ozgur Turkoglu2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

Dit paper introduceert FEX, een nieuw framework dat attributie-gebaseerde uitleggen via waarschijnlijkheidsverdelingen en policy gradient-optimalisatie mogelijk maakt, waardoor de inferentietijd met meer dan 97% en het geheugengebruik met 70% wordt gereduceerd ten opzichte van traditionele model-onafhankelijke methoden, terwijl de kwaliteit en toepasbaarheid behouden blijven.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Dit paper identificeert en analyseert een 'corruptiestadium' tijdens het few-shot fine-tunen van diffusiemodellen, waarbij beeldkwaliteit tijdelijk verslechtert door een versmalde leerverdeling, en lost dit op door Bayesiaanse neurale netwerken toe te passen om de distributie te verbreden en zo de beeldkwaliteit, diversiteit en trouw te verbeteren zonder extra inferentiekosten.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

DKDL-Net: A Lightweight Bearing Fault Detection Model via Decoupled Knowledge Distillation and Low-Rank Adaptation Fine-tuning

Dit artikel introduceert DKDL-Net, een lichtgewicht model voor het detecteren van defecten in rollende lagers dat decoupled knowledge distillation en low-rank adaptatie combineert om een nauwkeurigheid van 99,48% te bereiken met aanzienlijk minder parameters dan bestaande methoden.

Ovanes Petrosian, Li Pengyi, He Yulong + 4 more2026-03-10🤖 cs.LG

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

Dit artikel introduceert een gestructureerd semiparametrisch raamwerk dat dubbel machine learning combineert met modellen voor algoritmekeuze en kijkersrespons om de vertekende schattingen van behandelingseffecten door algoritmische interferentie in tweezijdige markten te corrigeren en zo nauwkeurige globale effecten voor platformrollouts te kunnen bepalen.

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling Jiang2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

Dit paper introduceert LAMBDA, een open-source, codevrij multi-agent systeem dat grote taalmodellen gebruikt om data-analyse te stroomlijnen via een samenwerking tussen programmeur- en inspecteur-agenten, met ondersteuning voor menselijke ingrepen en externe kennisintegratie.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Dit paper introduceert OTAD, een robuust model dat optimale transporttheorie combineert met convex integratie om Deep Neural Networks zowel nauwkeurig te laten trainen als gegarandeerd lokaal Lipschitz-continu te houden, waardoor ze beter bestand zijn tegen agnostische adversarial attacks dan bestaande methoden.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance

Dit artikel legt de statistische fundamenten voor de mini-batch maximum partiële-likelihood-schatter (mb-MPLE) in diepe Cox-modellen, bewijst de consistentie en optimale convergentie, en biedt praktische richtlijnen voor het gebruik van stochastische gradiëntafstijging (SGD) in zowel theoretische als grote-scale toepassingen.

Lang Zeng, Weijing Tang, Zhao Ren, Ying Ding2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Deze paper introduceert een efficiënt variational learning-algoritme voor Gaussian Process Latent Variable Models dat Annealed Importance Sampling combineert met reparameterisatie om de beperkingen van bestaande methoden in complexe, hoogdimensionale ruimtes te overwinnen en superieure prestaties te leveren.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

The Z-Gromov-Wasserstein Distance

Dit artikel introduceert de Z-Gromov-Wasserstein-afstand als een verenigend theoretisch raamwerk voor het vergelijken van Z-netwerken, waarbij het bestaande varianten omvat en waarborgt dat de resulterende ruimte wenselijke eigenschappen zoals volledigheid en geodeitische structuur behoudt.

Martin Bauer, Facundo Mémoli, Tom Needham + 1 more2026-03-10🤖 cs.LG

From Model Explanation to Data Misinterpretation: A Cautionary Analysis of Post Hoc Explainers in Business Research

Deze studie waarschuwt dat post-hoc uitlegmiddelen zoals SHAP en LIME, hoewel veel gebruikt in bedrijfsresearch, onbetrouwbaar zijn voor het valideren van hypothesen over onderliggende data-relaties vanwege hun gevoeligheid voor correlaties en het Rashomon-effect, en pleit ervoor ze uitsluitend te gebruiken als verkennende hulpmiddelen.

Tong Wang (Jeffrey), Ronilo Ragodos (Jeffrey), Lu Feng (Jeffrey), Yu (Jeffrey), Hu2026-03-10🤖 cs.LG

Reconsidering the energy efficiency of spiking neural networks

Deze paper weerlegt de vaak te optimistische aannames over de energie-efficiëntie van spiking neural networks door een rigoureuze vergelijking met kwantiseerde neurale netwerken te maken en aantoont dat SNNs alleen onder specifieke voorwaarden, zoals een lage spierate, daadwerkelijk energiebesparend zijn, wat kan leiden tot een verdubbeling van de batterijduur van apparaten zoals smartwatches.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Dit artikel introduceert een nieuw model voor gekoppelde oscillator-netwerken dat de wiskundige structuur van fysische systemen behoudt en globale stabiliteit garandeert, waardoor effectieve modelgebaseerde regeling in een latente ruimte mogelijk wordt, zelfs wanneer alleen ruwe beelden als feedback worden gebruikt.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing

Dit paper introduceert xTED, een framework dat een speciaal ontworpen diffusion-model gebruikt om bron-domein trajecten direct op data-niveau aan te passen aan het doel-domein, waardoor complexe domein-specifieke modellen worden vermeden en de prestaties van beleidsleer worden verbeterd.

Haoyi Niu, Qimao Chen, Tenglong Liu, Jianxiong Li, Guyue Zhou, Yi Zhang, Jianming Hu, Xianyuan Zhan2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Dit paper introduceert BNEM, een geavanceerde Boltzmann-sampler die op basis van bootstrapping en noised energy matching neural networks traint om energie-functies te leren voor het genereren van robuuste en state-of-the-art onafhankelijke steekproeven zonder vooraf bestaande data.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action

Dit artikel bewijst dat beleidsgradiëntmethoden, ondanks de niet-convexe aard van de optimalisatie, met een niet-asymptotische snelheid convergeren naar een globaal optimaal beleid voor eind-horizon MDP's met algemene toestanden en acties door gebruik te maken van de Polyak-Łojasiewicz-Kurdyka (PLK)-voorwaarde, wat leidt tot nieuwe sample-complexiteit garanties voor diverse operationele modellen zoals voorraad- en kasbalanssystemen.

Xin Chen, Yifan Hu, Minda Zhao2026-03-10🤖 cs.LG

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Deze paper introduceert Neural Delay Differential Equations (NDDEs), een continu-tijd framework dat geïnspireerd is op het Mori-Zwanzig formalisme en effectief niet-Markoviaanse dynamica leert uit gedeeltelijk waarneembare data door geheugeneffecten te modelleren via tijdvertragingen.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Open-World Reinforcement Learning over Long Short-Term Imagination

Dit paper introduceert LS-Imagine, een methode die de verbeeldingshorizon van visuele reinforcement learning-agenten uitbreidt door een lang-kortetermijnwereldmodel te gebruiken, waardoor de verkenningsefficiëntie in complexe open werelden zoals MineDojo aanzienlijk verbetert.

Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin, Yang Li, Wenjun Zeng, Xiaokang Yang2026-03-10🤖 cs.LG

How Learning Dynamics Drive Adversarially Robust Generalization?

Dit artikel introduceert een PAC-Bayesiaans analytisch raamwerk dat adversarial training als een discreet tijdsysteem modelleert om het mechanisme van robust overfitting te verklaren en aan te tonen hoe adversarial weight perturbation de generalisatie verbetert door de kromming van de verliesfunctie te onderdrukken, zij het met een mogelijk suboptimale optimalisatie door over-penaliseren.

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Dit artikel toont aan dat transformers in een in-context learning setting, zonder testtijd-gradiëntupdates of expliciete modelkennis, de verborgen toestanden van dynamische systemen impliciet kunnen schatten om nauwkeurige voorspellingen te doen die vergelijkbaar zijn met die van de Kalman-filter en andere geavanceerde filterschatters.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

← Vorige Volgende →