cs.LG papers | Gist.Science

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

Dit paper introduceert Mashup Learning, een methode die door het samenvoegen van de meest relevante historische checkpoints een betere startpositie biedt voor het finetunen van taalmodellen, wat leidt tot hogere nauwkeurigheid en aanzienlijk snellere convergentie vergeleken met training vanaf nul.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning

Dit paper introduceert ReMix, een nieuwe routeringsmethode voor Mixture-of-LoRAs die het probleem van onbalans in leerbare routingsgewichten oplost door niet-leerbare gewichten te combineren met een onbevooroordeelde gradiëntschatter op basis van reinforcement learning, wat leidt tot een aanzienlijk betere prestatie dan bestaande parameter-efficiënte finetuning-methoden.

Ruizhong Qiu, Hanqing Zeng, Yinglong Xia, Yiwen Meng, Ren Chen, Jiarui Feng, Dongqi Fu, Qifan Wang, Jiayi Liu, Jun Xiao, Xiangjun Fan, Benyu Zhang, Hong Li, Zhining Liu, Hyunsik Yoo, Zhichen Zeng, Tianxin Wei, Hanghang Tong2026-03-12🤖 cs.LG

DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning

Deze studie introduceert DT-BEHRT, een interpreteerbare transformer-architectuur die ziekteverloop bewust modelleert door diagnosegerichte interacties binnen orgaansystemen en asynchrone progressiepatronen te integreren, wat leidt tot robuuste en klinisch relevante patiëntrepresentaties op basis van elektronische gezondheidsdossiers.

Deyi Li, Zijun Yao, Qi Xu, Muxuan Liang, Lingyao Li, Zijian Xu, Mei Liu2026-03-12🤖 cs.LG

Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent

Deze paper presenteert een systematische theorie voor stabiliteit en robuustheid in bandit-inferentie door middel van een geregulariseerde stochastische spiegelafstijgingsbenadering, die geldige statistische conclusies mogelijk maakt onder adaptieve bemonstering en corruptie, terwijl gelijktijdig optimale spijtbetalingen worden behaald.

Budhaditya Halder, Ishan Sengupta, Koustav Chowdhury, Koulik Khamaru2026-03-12📊 stat

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Dit paper introduceert ARCHE, een efficiënt end-to-end leergestuurde beeldcompressieframework dat zonder recurrente of transformer-componenten state-of-the-art rate-distortion-prestaties bereikt door een unificatie van hiërarchische, ruimtelijke en kanaalgebonden priors met adaptieve feature-recalibratie.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios Skodras2026-03-12⚡ eess

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Dit paper introduceert Adaptive Activation Cancellation (AAC), een real-time inferentieframework dat hallucinaties in grote taalmodellen effectief onderdrukt door deze te behandelen als gestructureerde interferentie, waardoor de feitelijke nauwkeurigheid op alle geteste schalen verbetert zonder enige afname in de algemene prestaties of vloeiendheid.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces

Dit artikel introduceert actor-versnelde Policy Dual Averaging, een methode die de theoretische convergentievoordelen van PDA combineert met een geleerde actor-netwerk om de berekeningstijd in continue actie-ruimtes te verminderen en zo superieure prestaties te behalen ten opzichte van bestaande on-policy baselines zoals PPO.

Ji Gao, Caleb Ju, Guanghui Lan, Zhaohui Tong2026-03-12🤖 cs.LG

Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion

Dit paper introduceert een hybride Hidden Markov Model dat discrete markttoestanden combineert met een jump-diffusie-mechanisme om synthetische beursdata te genereren die zowel zware staarten als volatiliteitsclusteren nauwkeurig nabootsen, waardoor het superieur is aan traditionele GARCH- en HMM-modellen voor stress-testen en risicomodellering.

Abdulrahman Alswaidan, Jeffrey D. Varner2026-03-12💰 q-fin

Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training

Deze paper introduceert Flexible Cutoff Learning (FCL), een methode die het mogelijk maakt om de straal van de afkapfunctie in machine learning interatomaire potentialen na het trainen aan te passen, waardoor de nauwkeurigheids-kostenefficiëntie voor specifieke toepassingen kan worden geoptimaliseerd zonder het model opnieuw te hoeven trainen.

Rick Oerder (Institute for Numerical Simulation, University of Bonn, Fraunhofer Institute for Algorithms and Scientific Computing SCAI), Jan Hamaekers (Fraunhofer Institute for Algorithms and Scientific Computing SCAI)2026-03-12🔬 cond-mat.mtrl-sci

FusionNet: a frame interpolation network for 4D heart models

Dit paper introduceert FusionNet, een neuraal netwerk dat hoge-temporale-resolutie 4D-hartbewegingen reconstrueert uit kortdurende CMR-beelden door tussenliggende 3D-vormen te schatten, waarbij een Dice-score van meer dan 0,897 wordt bereikt.

Chujie Chang, Shoko Miyauchi, Ken'ichi Morooka, Ryo Kurazume, Oscar Martinez Mozos2026-03-12🤖 cs.LG

SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction

Dit artikel introduceert SDSR, een schaalbaar spectrale divide-and-conquer-algoritme voor het reconstrueren van soortbomen dat, onder het multispecies coalescent-model, een tot 10-voudige snelheidswinst biedt ten opzichte van bestaande methoden zonder in te boeten aan nauwkeurigheid.

Ortal Reshef (Hebrew University of Jerusalem), Ofer Glassman (Weizmann Institute of Science), Or Zuk (Hebrew University of Jerusalem), Yariv Aizenbud (Tel Aviv University), Boaz Nadler (Weizmann Institute of Science), Ariel Jaffe (Hebrew University of Jerusalem)2026-03-12🧬 q-bio

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Dit artikel analyseert een continu-tijd diffusi benadering van policy gradient voor stochastische bandieten en bewijst dat de spijt afhankelijk is van de leersnelheid, waarbij een optimale leersnelheid nodig is om lineaire spijt te voorkomen.

Tor Lattimore2026-03-12📊 stat

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Deze paper breidt het harmonische verlies uit door een breed scala aan niet-Euclidische afstandsmaten te onderzoeken en toont aan dat met name cosinus-afstand de prestaties, interpretatie en duurzaamheid van zowel visuele als taalkundige modellen verbetert ten opzichte van de standaard kruis-entropieverliesfunctie.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

In dit artikel wordt een nieuw trust-region interior-point stochastisch sequentieel kwadratisch programmeringsalgoritme (TR-IP-SSQP) voorgesteld voor het oplossen van optimalisatieproblemen met een stochastische doelfunctie en deterministische niet-lineaire constraints, waarvan de globale convergentie naar stationaire punten wordt bewezen en de praktische prestaties worden getest op CUTEst-problemen en logistische regressie.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

Het paper introduceert I2X, een raamwerk dat ongestructureerde interpretatie omzet in gestructureerde, prototype-gebaseerde verklaringen voor beeldclassificatiemodellen, waardoor niet alleen het besluitvormingsproces transparant wordt maar ook de voorspellingsnauwkeurigheid kan worden verbeterd door gerichte fine-tuning.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

Het artikel introduceert One-A, een unificerend raamwerk voor stap-ongeweven klassen-incrementeel leren dat door asymmetrische subspace-alignatie en gerichte gating een enkele adapter gebruikt om stabiel en efficiënt te leren van taken met sterk variërende grootte.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Dit onderzoek toont aan dat een neuromorfe algoritme voor het oplossen van partiële differentiaalvergelijkingen intrinsiek zeer robuust is tegen structurele storingen, waarbij tot 32% van de neuronen en 90% van de spikes verloren kunnen gaan zonder significante nauwkeurigheidsverlies.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

Dit paper introduceert SiMPO, een unificerend raamwerk voor online diffusiële versterkende leer dat het gebruik van negatieve steekproeven mogelijk maakt door een virtueel doelbeleid te construeren via een getekend maatstelsel, waardoor suboptimale acties effectief worden afgestoten en de prestaties worden verbeterd.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Dit artikel toont aan dat wanneer de prior in een Bayesiaans hiërarchisch model een canonieke verdeling is, de resulterende afhankelijke marginale prior ook een maximum-entropie-eigenschap bezit, maar dan met een andere constraint op de marginale verdeling van een functie van de onbekende grootheden.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Dit paper verbetert de kwaliteit en causaliteit van synthetische tabulaire data gegenereerd door TabPFN door de autoregressieve generatie te integreren met causale structuren via DAG-gerichte conditionering en CPDAG-strategieën.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

← Vorige Volgende →