cs.LG papers | Gist.Science

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

Deze paper introduceert ES-dLLM, een trainingsvrij raamwerk dat de inferentie van diffusion-taalmodellen versnelt door tokens in vroege lagen te overslaan op basis van variatie in tussentijdse representaties, wat resulteert in een tot 16,8 keer hogere snelheid zonder kwaliteitsverlies.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

A Survey of Weight Space Learning: Understanding, Representation, and Generation

Deze survey introduceert Weight Space Learning als een nieuw onderzoeksgebied dat neurale netwerkgewichten als een gestructureerd domein behandelt, en biedt een unificerende taxonomie van methoden voor het begrijpen, representeren en genereren van gewichten om toepassingen zoals modelretrieval en kennisoverdracht te faciliteren.

Xiaolong Han, Zehong Wang, Bo Zhao, Binchi Zhang, Jundong Li, Damian Borth, Rose Yu, Haggai Maron, Yanfang Ye, Lu Yin, Ferrante Neri2026-03-12🤖 cs.LG

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

Deze paper introduceert Equivariant Asynchronous Diffusion (EAD), een nieuw diffusion-model dat een adaptief, asynchroon ontmiddelingschema gebruikt om de hiërarchische structuur van moleculen beter te vangen en zo de prestaties bij het genereren van 3D-moleculaire conformaties te verbeteren.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Rethinking Adam for Time Series Forecasting: A Simple Heuristic to Improve Optimization under Distribution Shifts

Dit paper introduceert TS_Adam, een lichtgewicht variant van de Adam-optimizer die door het verwijderen van de tweede-orde correctie de prestaties van tijdreeksvoorspellingmodellen aanzienlijk verbetert bij niet-stationaire data met distributiedrift.

Yuze Dong, Jinsong Wu2026-03-12🤖 cs.LG

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Dit paper introduceert Code-Space Response Oracles (CSRO), een nieuw raamwerk dat Large Language Models gebruikt om in plaats van ondoorzichtige neurale netten interpreteerbare, menselijke code te genereren voor multi-agent beleidsstrategieën, waardoor complexe speltheoretische evenwichten transparanter en betrouwbaarder worden.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Denoising the US Census: Succinct Block Hierarchical Regression

Dit paper introduceert BlueDown, een nieuwe post-processing-methode die de nauwkeurigheid en consistentie van de door het Amerikaanse Census Bureau gegenereerde demografische datasets verbetert door een statistisch optimaal hiërarchisch regressie-algoritme te combineren met geavanceerde optimalisatie voor het behoud van privacy en structurele constraints.

Badih Ghazi, Pritish Kamath, Ravi Kumar, Pasin Manurangsi, Adam Sealfon2026-03-12🤖 cs.LG

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Dit paper introduceert een hardware-efficiënte "soft sparsity"-benadering met een instelbare fouttolerantie die, via een aangepaste RISC-V-instructie, de reken- en stroomverbruik van CNN's aanzienlijk verlaagt zonder in te leveren op nauwkeurigheid.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Het CLIPO-papier introduceert een contrastief leermethode binnen beleidsoptimalisatie die het RLVR-framework generaliseert door de consistentie van tussenstappen te waarborgen, waardoor hallucinaties worden onderdrukt en de robuustheid en generalisatie van redenerende grote taalmodellen aanzienlijk worden verbeterd.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

Dit artikel toont aan dat het "Lost in the Middle"-fenomeen een inherente geometrische eigenschap is van de architectuur van causal decoders die al bij initialisatie aanwezig is, ongeacht training of positiële encoding, en wordt veroorzaakt door de interactie tussen causale masking en residual connections.

Borun D Chowdhury2026-03-12🤖 cs.LG

Unbalanced Optimal Transport Dictionary Learning for Unsupervised Hyperspectral Image Clustering

Deze paper introduceert een nieuwe methode voor ongecontroleerde clustering van hyperspectrale beelden die onbalans optimaal transport en barycentra gebruikt om de beperkingen van eerdere gebalanceerde benaderingen te overwinnen, waardoor robuustere en scherpere clusterresultaten worden bereikt.

Joshua Lentz, Nicholas Karris, Alex Cloninger, James M. Murphy2026-03-12📊 stat

A neural operator for predicting vibration frequency response curves from limited data

Dit artikel introduceert een neurale operator die, zonder expliciete fysische regularisatie, uit beperkte data de volledige trillingsfrequentieresponscurve van een lineair systeem kan voorspellen met een nauwkeurigheid van 99,87%, waardoor het ontwerp- en testproces van engineeringcomponenten aanzienlijk kan worden versneld.

D. Bluedorn, A. Badawy, B. E. Saunders, D. Roettgen, A. Abdelkefi2026-03-12🤖 cs.LG

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

Dit paper introduceert Mashup Learning, een methode die door het samenvoegen van de meest relevante historische checkpoints een betere startpositie biedt voor het finetunen van taalmodellen, wat leidt tot hogere nauwkeurigheid en aanzienlijk snellere convergentie vergeleken met training vanaf nul.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning

Dit paper introduceert ReMix, een nieuwe routeringsmethode voor Mixture-of-LoRAs die het probleem van onbalans in leerbare routingsgewichten oplost door niet-leerbare gewichten te combineren met een onbevooroordeelde gradiëntschatter op basis van reinforcement learning, wat leidt tot een aanzienlijk betere prestatie dan bestaande parameter-efficiënte finetuning-methoden.

Ruizhong Qiu, Hanqing Zeng, Yinglong Xia, Yiwen Meng, Ren Chen, Jiarui Feng, Dongqi Fu, Qifan Wang, Jiayi Liu, Jun Xiao, Xiangjun Fan, Benyu Zhang, Hong Li, Zhining Liu, Hyunsik Yoo, Zhichen Zeng, Tianxin Wei, Hanghang Tong2026-03-12🤖 cs.LG

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

Deze studie introduceert DT-BEHRT, een interpreteerbare transformer-architectuur die ziekteverloop bewust modelleert door diagnosegerichte interacties binnen orgaansystemen en asynchrone progressiepatronen te integreren, wat leidt tot robuuste en klinisch relevante patiëntrepresentaties op basis van elektronische gezondheidsdossiers.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Deze paper presenteert een systematische theorie voor stabiliteit en robuustheid in bandit-inferentie door middel van een geregulariseerde stochastische spiegelafstijgingsbenadering, die geldige statistische conclusies mogelijk maakt onder adaptieve bemonstering en corruptie, terwijl gelijktijdig optimale spijtbetalingen worden behaald.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Dit paper introduceert ARCHE, een efficiënt end-to-end leergestuurde beeldcompressieframework dat zonder recurrente of transformer-componenten state-of-the-art rate-distortion-prestaties bereikt door een unificatie van hiërarchische, ruimtelijke en kanaalgebonden priors met adaptieve feature-recalibratie.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Dit paper introduceert Adaptive Activation Cancellation (AAC), een real-time inferentieframework dat hallucinaties in grote taalmodellen effectief onderdrukt door deze te behandelen als gestructureerde interferentie, waardoor de feitelijke nauwkeurigheid op alle geteste schalen verbetert zonder enige afname in de algemene prestaties of vloeiendheid.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Dit artikel introduceert actor-versnelde Policy Dual Averaging, een methode die de theoretische convergentievoordelen van PDA combineert met een geleerde actor-netwerk om de berekeningstijd in continue actie-ruimtes te verminderen en zo superieure prestaties te behalen ten opzichte van bestaande on-policy baselines zoals PPO.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Dit paper introduceert een hybride Hidden Markov Model dat discrete markttoestanden combineert met een jump-diffusie-mechanisme om synthetische beursdata te genereren die zowel zware staarten als volatiliteitsclusteren nauwkeurig nabootsen, waardoor het superieur is aan traditionele GARCH- en HMM-modellen voor stress-testen en risicomodellering.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Deze paper introduceert Flexible Cutoff Learning (FCL), een methode die het mogelijk maakt om de straal van de afkapfunctie in machine learning interatomaire potentialen na het trainen aan te passen, waardoor de nauwkeurigheids-kostenefficiëntie voor specifieke toepassingen kan worden geoptimaliseerd zonder het model opnieuw te hoeven trainen.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

← Vorige Volgende →