cs.LG papers | Gist.Science

How Learning Dynamics Drive Adversarially Robust Generalization?

Dit artikel introduceert een PAC-Bayesiaans analytisch raamwerk dat adversarial training als een discreet tijdsysteem modelleert om het mechanisme van robust overfitting te verklaren en aan te tonen hoe adversarial weight perturbation de generalisatie verbetert door de kromming van de verliesfunctie te onderdrukken, zij het met een mogelijk suboptimale optimalisatie door over-penaliseren.

Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

Transformers as Implicit State Estimators: In-Context Learning in Dynamical Systems

Dit artikel toont aan dat transformers in een in-context learning setting, zonder testtijd-gradiëntupdates of expliciete modelkennis, de verborgen toestanden van dynamische systemen impliciet kunnen schatten om nauwkeurige voorspellingen te doen die vergelijkbaar zijn met die van de Kalman-filter en andere geavanceerde filterschatters.

Usman Akram, Haris Vikalo2026-03-10🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

Deze paper introduceert een adaptief transferleringskader voor clustering dat automatisch gemeenschappelijke patronen benut tussen een hoofd- en een hulpdataset, ondanks onbekende verschillen, om zo de prestaties te optimaliseren via een geoptimaliseerde bias-variatie-decompositie.

Yuqi Gu, Zhongyuan Lyu, Kaizheng Wang2026-03-10🤖 cs.LG

A Learned Proximal Alternating Minimization Algorithm and Its Induced Network for a Class of Two-block Nonconvex and Nonsmooth Optimization

Deze paper introduceert het LPAM-algoritme en het daarop gebaseerde interpreteerbare LPAM-netwerk voor het oplossen van niet-convexe en niet-gladde optimalisatieproblemen met twee blokken, waarbij de convergentie wordt gegarandeerd en de effectiviteit wordt aangetoond via toepassing op MRI-reconstructie.

Yunmei Chen, Lezhi Liu, Lei Zhang2026-03-10🤖 cs.LG

Autoassociative Learning of Structural Representations for Modeling and Classification in Medical Imaging

Deze studie introduceert een neurosymbolisch systeem dat medische beelden reconstrueert via visuele primitieven om transparante en nauwkeurigere diagnoses van histologische afwijkingen te leveren dan traditionele deep learning-architecturen.

Zuzanna Buchnajzer, Kacper Dobek, Stanisław Hapke, Daniel Jankowski, Krzysztof Krawiec2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

Dit paper introduceert Puppet-CNN, een raamwerk dat convolutieparameters modelleert als een continu dynamisch systeem bestuurd door een neurale ODE, waardoor het aantal effectieve lagen input-adaptief kan worden aangepast en het aantal op te slaan trainbare parameters aanzienlijk wordt gereduceerd.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Deze paper introduceert een raamwerk voor diffusiemodellen dat de generatiedynamiek aanpast aan de complexiteit van elk individueel voorbeeld, waardoor het aantal benodigde steekproefstappen wordt verminderd zonder in te leveren op de kwaliteit.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

Optimizing Locomotor Task Sets in Biological Joint Moment Estimation for Hip Exoskeleton Applications

Deze studie introduceert een optimalisatiestrategie voor locomotorische taaksets die, door middel van clusteranalyse, een minimale maar representatieve set taken identificeert om biologische heupmomenten nauwkeurig te schatten met minder data en zonder in te leveren op prestaties.

Jimin An, Changseob Song, Eni Halilaj + 1 more2026-03-10🤖 cs.LG

Finite Sample Bounds for Non-Parametric Regression: Optimal Sample Efficiency and Space Complexity

Dit paper introduceert een parametrische aanpak voor niet-parametrische regressie die optimale convergentiepercentages bereikt met minimale geheugeneisen, waardoor het geschikt is voor real-time toepassingen zoals versterkingsleren.

Davide Maran, Marcello Restelli2026-03-10🤖 cs.LG

GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications

Dit artikel onderzoekt het potentieel van generatieve diffusiemodellen (GDM) voor massieve MIMO-communicatiesystemen, met name door een overzicht te geven van de technologie, recente vooruitgang en een case study voor kanaalschatting, terwijl het ook toekomstige uitdagingen en onderzoeksdirections identificeert.

Zhenzhou Jin, Li You, Huibin Zhou + 6 more2026-03-10⚡ eess

Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control

Dit onderzoek onderzoekt de invloed van inbeddings-priors op prompt-tuning en onthult dat modellen effectief kunnen werken met inbeddings in nieuwe gebieden van de activeringsruimte, terwijl het een duidelijke clustering van activeringen voor verre taken versus vergelijkbare NLP-taken laat zien.

Sergey Sedov, Sumanth Bharadwaj Hachalli Karanam, Venu Gopal Kadamba2026-03-10🤖 cs.LG

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Deze paper introduceert een methode die voorgeprende vision-language modellen gebruikt om symbolische wereldmodellen te leren uit korte demonstraties, waardoor robots in staat zijn om via planning complexe, lange-horizon taken in nieuwe omgevingen en met nieuwe doelen op te lossen.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

UFGraphFR: Graph Federation Recommendation System based on User Text description features

Dit paper introduceert UFGraphFR, een privacybehoudend federatief aanbevelingssysteem dat semantische tekstkenmerken gebruikt om globale gebruikersrelatiegrafen veilig te reconstrueren en zo de aanbevelingsnauwkeurigheid en personalisatie significant verbetert.

Xudong Wang, Qingbo Hao, Yingyuan Xiao2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Deze paper introduceert efficiënte data-reductiestrategieën voor semi-supervised adversarial training door middel van latent clustering, waardoor de benodigde hoeveelheid ongelabelde data en rekentijd aanzienlijk worden verminderd zonder in te leveren op de modelrobustheid.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

The Exploration of Error Bounds in Classification with Noisy Labels

Dit artikel analyseert de generalisatieprestaties van deep learning-classificatiemodellen met ruis in de labels door theoretische foutgrenzen voor de excess risk af te leiden, waarbij statistische afhankelijkheden en de impact van hoge dimensies worden aangepakt via onafhankelijke blokken en het lage-dimensionale manifold-hypothese.

Haixia Liu, Boxiao Li, Can Yang, Yang Wang2026-03-10🤖 cs.LG

Strengthening Generative Robot Policies through Predictive World Modeling

Dit artikel introduceert Generative Predictive Control (GPC), een leerframework dat een generatieve diffusiebeleid combineert met een voorspellend wereldmodel om online planning te verbeteren, wat resulteert in superieure prestaties ten opzichte van gedragskloning bij diverse robotmanipulatietaken in zowel simulatie als de echte wereld.

Han Qi, Haocheng Yin, Aris Zhu, Yilun Du, Heng Yang2026-03-10🤖 cs.LG

General Coded Computing in a Probabilistic Straggler Regime

Dit artikel analyseert theoretisch en experimenteel hoe twee algemene gecodeerde berekeningsschema's (BACC en LeTCC) in een probabilistisch trage-serverregime toch een convergentie van de benaderingsfout naar nul bereiken, ondanks dat het gemiddelde aantal trage servers evenredig is met de totale servergrootte.

Parsa Moradi, Mohammad Ali Maddah-Ali2026-03-10🤖 cs.LG

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Dit paper introduceert GRADIEND, een nieuwe encoder-decoder-methode die modelgradiënten gebruikt om bias-gerelateerde neurale kenmerken te identificeren en modellen effectief te debiasen zonder hun andere vaardigheden te verliezen.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Deze studie analyseert de beveiliging en kwaliteit van door LLM's gegenereerde code in meerdere programmeertalen en concludeert dat hoewel AI-codegeneratie mogelijk is, de effectiviteit varieert en vaak tekortschiet in het toepassen van moderne beveiligingsfuncties en best practices.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David Mohaisen2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Deze paper introduceert een efficiënt lokaal zoekalgoritme voor het ontdekken van $k$ gepolariseerde gemeenschappen in getekende netwerken, dat een nieuw optimalisatiedoelwit combineert met een lineaire convergentie om zowel onbalans in gemeenschapsgrootte als de aanwezigheid van neutrale knopen effectief aan te pakken.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

← Vorige Volgende →