cs.LG papers | Gist.Science

Boosting deep Reinforcement Learning using pretraining with Logical Options

Dit paper introduceert H²RL, een hybride twee-trapskader dat logische opties gebruikt voor pretraining om deep reinforcement learning-agenten te sturen naar doelgericht gedrag en zo de misalignering door kortetermijnbeloningen op te lossen.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

Dit paper introduceert AllScAIP, een schaalbaar, op attention gebaseerd machine-learning potentiaalmodel dat door middel van een data-gedreven all-to-all node attention-mechanisme nauwkeurige lange-afstand interacties captureert en daarmee de afhankelijkheid van expliciete fysische termen voor grootschalige systemen zoals biomoleculen en elektrolyten overbodig maakt.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

SCOPE introduceert een plug-and-play framework dat bestaande 3D-segmentatiemethoden verbetert door ongelabelde achtergrondinformatie te benutten voor het verrijken van prototypes, waardoor nieuwe categorieën effectief kunnen worden geleerd met weinig annotaties en zonder vergeten van eerder geleerde kennis.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

Het paper introduceert BEVLM, een raamwerk dat semantische kennis van grote taalmodellen distilleert naar Bird's-Eye View-representaties om de ruimtelijke coherentie te verbeteren en zo de prestaties van autonoom rijden aanzienlijk te verhogen.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Linear Multidimensional Regression with Interactive Fixed-Effects

Dit artikel introduceert een Neyman-orthogonale schatter voor lineaire regressie met interactieve vaste effecten in meervoudige paneldata, die via een tweestapsprocedure een parametrische convergentiesnelheid bereikt en wordt toegepast om de vraagelasticiteit voor bier te schatten.

Hugo Freeman2026-03-06💻 cs

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

Dit artikel introduceert twee nieuwe nulde-orde algoritmen, ZO-PDAPG en ZO-RMPDPG, voor het oplossen van niet-convexe minimax-problemen met gekoppelde lineaire constraints, waarbij voor het eerst iteratiecomplexiteitsgaranties worden bewezen die bovendien de huidige staat van de techniek verbeteren.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

Data Collaboration Analysis with Orthonormal Basis Selection and Alignment

Deze paper introduceert Orthonormal Data Collaboration (ODC), een methode die door het afdwingen van orthonormale bases de uitlijning van gedeelde projecties reduceert tot een gesloten-formule oplossing, waardoor de nauwkeurigheid en stabiliteit van Data Collaboration aanzienlijk worden verbeterd en de rekentijd tot 100 keer wordt verkort zonder de privacy of communicatiepatronen te schenden.

Keiyu Nosaka, Yamato Suetake, Yuichi Takano + 1 more2026-03-06🔢 math

Localized Distributional Robustness in Submodular Multi-Task Subset Selection

Dit artikel introduceert een nieuw, rekenefficiënt algoritme voor multi-task submodulaire subsetselectie dat lokale distributie-robuustheid bereikt door relatieve-entropy regularisatie, wat leidt tot een oplossing die een betere balans biedt tussen prestatie en robuustheid dan bestaande methoden.

Ege C. Kaya, Abolfazl Hashemi2026-03-06🔢 math

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Dit artikel presenteert een nieuwe leerbenadering voor Dubins Traveling Salesman Problems met buurten, die via twee fasen van versterkt leren en supervisie een snellere en effectievere oplossing biedt dan traditionele methoden door gebruik te maken van geprivilegieerde informatie.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

HEroBM: a deep equivariant graph neural network for universal backmapping from coarse-grained to all-atom representations

Dit paper introduceert HEroBM, een schaalbaar en universeel deep learning-kader dat gebruikmaakt van equivariante grafische neurale netwerken om nauwkeurig en efficiënt atomaire structuren te reconstrueren uit grofkorrelige modellen voor diverse chemische systemen.

Daniele Angioletti, Stefano Raniolo, Vittorio Limongelli2026-03-06🔬 physics

Learning to Cover: Online Learning and Optimization with Irreversible Decisions

Dit artikel presenteert een asymptotisch optimaal algoritme voor online leren en optimalisatie met onomkeerbare beslissingen, waarbij een constructieve policy met beperkte exploratie gevolgd door snelle exploitatie de regret sublineair laat groeien terwijl de classifier convergeert naar de Bayes-optimale oplossing.

Alexandre Jacquillat, Michael Lingzhi Li2026-03-06🔢 math

Parallel Split Learning with Global Sampling

Dit paper introduceert GPSL, een server-gedreven split learning-methode die door globale steekproefneming de effectieve batchgrootte onafhankelijk maakt van het aantal clients en niet-IID-data bias elimineert, waardoor stabilisatie en centralisatie-achtige nauwkeurigheid worden bereikt met minimale overhead.

Mohammad Kohankhaki, Ahmad Ayad, Mahdi Barhoush + 1 more2026-03-06💻 cs

Towards a Fairer Non-negative Matrix Factorization

Dit artikel introduceert een min-max formulering voor niet-negatieve matrixfactorisatie (NMF) om de eerlijkheid in machine learning te verbeteren, waarbij twee optimalisatiemethoden worden gepresenteerd en geëvalueerd met synthetische en reële data, terwijl ook wordt erkend dat eerlijkheid niet-universeel is en soms ten koste gaat van individuele nauwkeurigheid.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Dit artikel presenteert een uitgebreide experimentele studie die aantoont dat eerlijkheidsbewuste machine learning-modellen in het kredietscoringproces een betere balans bereiken tussen voorspellende nauwkeurigheid en eerlijkheid dan traditionele classificatiemodellen.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Dit paper introduceert Path Planning (P2), een nieuwe inferentie-strategie voor gemaskerde diffusiemodellen die generatiekwaliteit aanzienlijk verbetert door bestaande tokens iteratief te verfijnen via een plannings- en een denoising-fase, wat leidt tot state-of-the-art prestaties op diverse domeinen zoals eiwitsequenties en codegeneratie.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Dit artikel demonstreert dat de vervloeking van de dimensionaliteit optreedt bij het trainen van ondiepe neurale netwerken met Lipschitz-continuïteit, waarbij de convergentiesnelheid van het populatierisico wordt beperkt door de dimensie en de gladheid van de doelfunctie, zelfs bij gebruik van gradient flow-dynamica in de 2-Wasserstein-ruimte.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Deze paper breidt de bestaande entropiestroom-methode uit tot alle leeralgoritmen die worden gestuurd door een tijds-homogeen Markov-proces, waardoor er via een nieuwe exacte formule en verbindingen met Sobolev-ongelijkheden algemene generalisatiegrenzen kunnen worden afgeleid.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Sink equilibria and the attractors of learning in games

Dit paper weerlegt de conjectuur dat er een één-op-één-correspondentie bestaat tussen de attractoren van de replicatordynamiek en de sink-evenwichten in speltheorie door middel van tegenvoorbeelden, en introduceert het concept van pseudoconvexiteit als een voldoende voorwaarde om deze relatie voor twee-spelersspelen te karakteriseren.

Oliver Biggar, Christos Papadimitriou2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Dit paper introduceert FBFL, een nieuw veldgebaseerd coördinatiekader voor federatief leren dat door middel van gedistribueerde ruimtelijke leidersverkiezing en een zelforganiserende hiërarchische architectuur de uitdagingen van data-heterogeniteit en schaalbaarheid effectief aanpakt en in niet-IID-scenario's superieure prestaties levert vergeleken met bestaande methoden.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

De auteurs presenteren Clip21-SGD2M, een nieuwe methode voor Federated Learning die door een innovatieve combinatie van clipping, zware-bal-momentum en foutfeedback zowel optimale convergentie garandeert als sterke differentieel-privateits-eigenschappen biedt, zelfs bij sterk heterogene client-data.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

← Vorige Volgende →