cs.LG papers | Gist.Science

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Dit paper biedt de eerste theoretische scheiding tussen Adam en SGD door aan te tonen dat de tweede-momentnormalisatie in Adam zorgt voor een scherpere staart in de convergentie, met een afhankelijkheid van $\delta^{-1/2}$ in plaats van de noodzakelijke $\delta^{-1}$ bij SGD.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

Deze studie introduceert Compositional Probe Decomposition (CPD) om aan te tonen dat taakalignatie, meer dan de modelarchitectuur, bepaalt in hoeverre atomaire foundation models geometrische en compositie-informatie lineair ontkoppelen, waarbij symmetrie-gebaseerde routepatronen en een waarschuwing tegen niet-lineaire probes worden geïdentificeerd.

Joshua Steier2026-03-10🤖 cs.LG

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Dit paper introduceert XInsight, een multi-agent framework dat digitale psychologische ondersteuning structureert volgens het 'Exploration-Insight-Action'-paradigma met gespecialiseerde agents voor case-conceptualisering, therapeutische routing en reflectie, en introduceert XInsight-Bench voor transparante evaluatie om de bruikbaarheid van dergelijke systemen voor digitaal welzijn te vergroten.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng Wang2026-03-10🤖 cs.LG

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM

Dit paper introduceert vLLM Hook, een open-source plug-in die programmabele toegang biedt tot de interne staten van vLLM-modellen, waardoor zowel passieve analyse als actieve interventie mogelijk wordt voor toepassingen zoals het detecteren van prompt-injecties en het verbeteren van RAG-systemen.

Ching-Yun Ko, Pin-Yu Chen2026-03-10🤖 cs.LG

Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing

Dit paper introduceert de Isotonic Layer, een nieuw differentieerbaar raamwerk dat via monotoon geconstrueerde segmenten en leerbare embeddings systematische vertekeningen in aanbevelingssystemen corrigeert, wat resulteert in betere kalibratie, eerlijkheid en prestaties in productieomgevingen.

Hailing Cheng, Yafang Yang, Hemeng Tao, Fengyu Zhang2026-03-10🤖 cs.LG

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

Dit onderzoek identificeert de 'P0 Sink Circuit' als een semantiek-onafhankelijk mechanisme dat in de eerste twee lagen van grote taalmodellen zorgt voor de vorming van een aandachtssink op het eerste token, wat dient als een indicator voor de convergentie van pre-training.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng Qiu2026-03-10🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

Dit artikel toont aan dat hiërarchische structuren in het data-generatieproces de onderliggende oorzaak zijn van de opkomst van diverse mechanistische fenomenen in taalmodellen, en biedt een unificerende verklaring en synthetische hulpmiddelen voor interpretatieonderzoek.

Jonas Rohweder, Subhabrata Dutta, Iryna Gurevych2026-03-10🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

Dit paper introduceert Hierarchical Embedding Fusion (HEF), een tweestapsmethode die repository-informatie comprimeert naar een vaste set pseudo-tokens, waardoor de latency voor repository-gebaseerde codegeneratie aanzienlijk wordt verlaagd zonder in te leveren op de nauwkeurigheid.

Nikita Sorokin, Ivan Sedykh, Valentin Malykh2026-03-10🤖 cs.LG

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

Dit paper introduceert FuzzingRL, een methode die fuzzing en versterkingsfinetuning combineert om automatisch uitdagende vragen te genereren die de kwetsbaarheden van Vision Language Models onthullen en hun prestaties aanzienlijk verminderen.

Jiajun Xu, Jiageng Mao, Ang Qi, Weiduo Yuan, Alexander Romanus, Helen Xia, Vitor Campagnolo Guizilini, Yue Wang2026-03-10🤖 cs.LG

Switchable Activation Networks

Dit paper introduceert SWAN (Switchable Activation Networks), een raamwerk dat neurale eenheden van deterministische, input-afhankelijke binaire poorten voorziet om computationele efficiëntie te verhogen door adaptieve activatiepatronen te leren die zowel dynamische inferentie als compacte implementatie mogelijk maken.

Laha Ale, Ning Zhang, Scott A. King, Pingzhi Fan2026-03-10🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

Dit paper introduceert het Khatri-Rao-clusteringparadigma, dat traditionele centroid-gebaseerde methoden zoals k-Means en deep clustering uitbreidt door centra te modelleren als interacties van protocentra, waardoor aanzienlijk beknoptere en even nauwkeurige datasamenvattingen worden gegenereerd.

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki Mannila2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

Dit artikel toont aan dat data-duplicatie bij het voorbewerken van taalmodellen schaalafhankelijk is, waarbij semantische duplicaten bij grotere modellen steeds meer als exacte duplicaten fungeren en leiden tot verslechterende generalisatie en afwijkende schaalwetten.

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

Dit paper introduceert een genormaliseerde betrouwbaarheidsscore die fouten en hallucinaties in grote taalmodellen detecteert, en onthult dat supervisie fine-tuning (SFT) betere kalibratie biedt dan versterkingsleermethoden, terwijl het een post-RL SFT-strategie voorstelt om deze betrouwbaarheid te herstellen en efficiëntere retrieval-augmented generation (RAG) mogelijk te maken.

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

Dit artikel introduceert STAR-Set, een structure-bewuste Set Transformer die asynchrone klinische tijdsreeksen effectiever verwerkt door zachte attention-biasen toe te voegen voor tijdslokaliteit en variabele-affiniteit, wat leidt tot superieure prestaties op diverse IC-predictietaken vergeleken met bestaande methoden.

Joohyung Lee, Kwanhyung Lee, Changhun Kim, Eunho Yang2026-03-10🤖 cs.LG

LegoNet: Memory Footprint Reduction Through Block Weight Clustering

Deze paper introduceert LegoNet, een compressietechniek die blokken van modelgewichten clusteren om het geheugengebruik van neurale netwerken tot wel 128 keer te verminderen zonder hertraining, architectuurwijzigingen of verlies aan nauwkeurigheid.

Joseph Bingham, Noah Green, Saman Zonouz2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

Deze paper introduceert een gestructureerd benchmarkkader met geïsoleerde interferentiegames en uitgebreide datasets om de specifieke uitdagingen van multi-agent deep reinforcement learning voor C-V2X-resourceallocatie te ontrafelen, waarbij blijkt dat robustheid en generalisatie over diverse voertuigtopologieën de grootste obstakels vormen.

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

Deze paper introduceert de Two-Bridge Map Suite, een open-source benchmark voor StarCraft II die als tussenliggend niveau fungeert tussen de volledige game en mini-games, waardoor onderzoekers tactische vaardigheden kunnen bestuderen zonder de hoge rekenkosten van de volledige game.

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

Dit artikel introduceert een praktische methode die de Conditionele Randomisatietest combineert met het tabulaire foundationmodel TabPFN om geldige p-waarden te genereren voor het testen van de relevantie van individuele kenmerken, zelfs in complexe, niet-lineaire en gecorreleerde scenario's zonder dat hertraining of parametrische aannames nodig zijn.

Mohamed Salem2026-03-10🤖 cs.LG

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

Dit paper introduceert CapTrack, een kadersysteem dat vergeten in LLMs na post-training definieert als systematische gedragsdrift in plaats van alleen feitelijke kennisverlies, en via een grote empirische studie aantoont dat instructie-finetuning de grootste drift veroorzaakt terwijl voorkeursoptimalisatie conservatiever is.

Lukas Thede, Stefan Winzeck, Zeynep Akata, Jonathan Richard Schwarz2026-03-10🤖 cs.LG

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

Dit paper introduceert DeepScope, een diep-leringsysteem dat microscopische beelden van niet-geïncubeerde watermonsters analyseert om fecale vervuiling binnen seconden met 93% nauwkeurigheid te detecteren, waardoor de testtijd met meer dan 98% wordt verkort en de kosten dalen tot $0,44 per test.

Sanjay Srinivasan2026-03-10🤖 cs.LG

← Vorige Volgende →