cs.LG papers | Gist.Science

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

Dit paper introduceert In-Context RLVR, een methode die de kwaliteit van redeneringen binnen grote taalmodellen verbetert door in-Context Learning te gebruiken om beloningen automatisch te herwegen op basis van de bewijskracht van de oplossing, waardoor hoogwaardige redeneertraces meer gewicht krijgen dan die welke slechts per ongeluk tot het juiste antwoord leiden.

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Dit paper introduceert de 'smoothing pseudo-projector', een lichtgewicht correctiemodule die is geïnspireerd op het multigrid-paradigma en de robuustheid en trainingsdynamiek van transformer-modellen verbetert door ruis te onderdrukken zonder de kernarchitectuur te wijzigen.

Vitaly Bulgakov2026-03-11🤖 cs.AI

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

Dit paper introduceert een nieuw hiërarchisch multi-task multi-fidelity framework voor Gaussian processen dat de uitdagingen van grote databehoeften en heterogene datakwaliteit in de productie-effectieve surrogate-modellering tegelijkertijd aanpakt, wat resulteert in een tot 23% hogere voorspellingnauwkeurigheid.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui Shao2026-03-11🤖 cs.LG

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Dit paper introduceert HR-GAT, een hiërarchisch opgezet grafisch aandachtmodel dat geospatiale data gebruikt om de vraag naar spectrum nauwkeuriger te voorspellen dan bestaande methoden, wat essentieel is voor efficiënt spectrumbeheer.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

GAST: Gradient-aligned Sparse Tuning of Large Language Models with Data-layer Selection

Dit paper introduceert GAST, een innovatieve methode voor parameter-efficiënt fine-tuning van grote taalmodellen die door middel van een geünificeerde optimalisatiestrategie gelijktijdig de meest effectieve data-punten selecteert voor specifieke modellagen, waardoor redundantie wordt verminderd en de prestaties ten opzichte van bestaande methoden worden verbeterd.

Kai Yao, Zhenghan Song, Kaixin Wu, Mingjie Zhong, Danzhao Cheng, Zhaorui Tan, Yixin Ji, Penglei Gao2026-03-11🤖 cs.LG

CarbonBench: A Global Benchmark for Upscaling of Carbon Fluxes Using Zero-Shot Learning

Deze paper introduceert CarbonBench, het eerste wereldwijde benchmark voor het evalueren van zero-shot leermethoden om koolstoffluxen nauwkeurig te upscalen naar onbemonsterde ecosystemen, gebaseerd op meer dan 1,3 miljoen dagelijkse observaties van 567 meetstations.

Aleksei Rozanov, Arvind Renganathan, Yimeng Zhang, Vipin Kumar2026-03-11🤖 cs.LG

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Dit paper introduceert MSSR, een ervaringherhaalframework voor continue fine-tuning van grote taalmodellen dat op basis van geschatte geheugensterkte van individuele samples adaptieve herhalingsintervallen toepast om catastrofale vergeten te verminderen zonder de aanpassingssnelheid te vertragen.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Dit paper introduceert OptEMA, een adaptieve variant van de Exponential Moving Average voor stochastische optimalisatie die zonder kennis van Lipschitz-constanten werkt en in het ruisvrije regime een bijna optimale convergentiesnelheid bereikt zonder handmatige herschikking van hyperparameters.

Ganzhao Yuan2026-03-11🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

Dit paper onthult dat generatief drijven in wezen score-matching is, en biedt een spectrale en variationale theorie die de convergentie-eigenschappen verklaart, de keuze voor kernels onderbouwt en de noodzaak van de stop-gradient-operator voor stabiel training bewijst.

Erkan Turan, Maks Ovsjanikov2026-03-11🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

Dit paper introduceert SignalMC-MED, een multimodaal benchmark voor het evalueren van biosignaal-fundamentmodellen op gesynchroniseerde ECG- en PPG-gegevens, waarbij wordt vastgesteld dat domeinspecifieke modellen en multimodale fusie superieure prestaties leveren voor diverse klinische taken.

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton2026-03-11🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Dit artikel introduceert de Overfitting-Underfitting Indicator (OUI) als een efficiënt, vroeg signaal dat op basis van neuronale activatiepatronen al na 10% van de training succesvolle leerstappen in PPO-actor-critic modellen kan onderscheiden van instabiele of suboptimale configuraties.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Dit paper introduceert neurale debuggers, taalmodellen die traditionele debuggers nabootsen door interactieve controle over Python-uitvoering te bieden, waardoor zowel voorwaartse als achterwaartse uitvoeringsvoorspelling mogelijk wordt en de basis wordt gelegd voor geavanceerde agentische coderingssystemen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

Dit paper introduceert een nieuwe familie van gemiddeld genormaliseerde operatornormen en de MOGA-optimizer om breedte-onafhankelijke stabiliteit en effectieve hyperparameter-overdracht te garanderen voor neurale netwerken, waarbij het de stabiliteit van Muon verbetert en snellere prestaties bereikt in grote-token en laag-verlies regimes.

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Dit paper introduceert C2FMAE, een hiërarchisch maskerend autoencoder-model dat de spanning tussen contrastief leren en gemaskeerde beeldmodellering oplost door een grof-naar-fijn leerproces te gebruiken dat semantische, object- en pixelniveaus combineert voor robuustere visuele representaties.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

In tegenstelling tot mensen, die bij nadenken minder eerlijk worden, blijkt dat redenering bij grote taalmodellen de eerlijkheid verhoogt doordat het proces de modellen door een vertegenwoordigingsruimte leidt waar eerlijke antwoorden stabieler zijn dan leugenachtige.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Dit paper introduceert Bag-of-Words Superposition (BOWS) om aan te tonen dat in realistische scenario's met gecorreleerde features, superpositie constructieve interferentie kan genereren die semantische clusters en cyclische structuren vormt, in plaats van dat interferentie uitsluitend als ruis moet worden gefilterd zoals in het standaardbeeld van superpositie wordt aangenomen.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Deze paper introduceert het TAM-RL-framework, dat representatieleren koppelt aan fysisch onderbouwde beperkingen om de nauwkeurigheid en generaliseerbaarheid van het opschalen van terrestrische koolstofstromen aanzienlijk te verbeteren.

Aleksei Rozanov, Arvind Renganathan, Vipin Kumar2026-03-11🤖 cs.LG

Online Neural Networks for Change-Point Detection

In dit paper presenteren de auteurs twee online neurale netwerkbenaderingen voor het detecteren van veranderingen in tijdsreeksen die lineaire computationele complexiteit hebben, sneller convergeren naar optimale oplossingen en beter presteren dan bestaande methoden op zowel synthetische als real-world datasets.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

De auteurs stellen een nieuwe semi-parametrische BART-methode voor die covariaten in zowel het lineaire als het niet-parametrische component toelaat door de boomgeneratiebewegingen aan te passen, waardoor vertekening en niet-identificeerbaarheid worden opgelost en complexe interacties kunnen worden gemodelleerd, wat wordt gevalideerd via simulaties en toepassingen op onderwijsdata.

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Dit artikel presenteert een witte-doos SVM-framework, geoptimaliseerd met zwermalgoritmen, voor het toezicht op tandvormige freesmessen door middel van karakterisering van asvibraties en selectie van relevante statistische kenmerken.

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. Patange2026-03-10🤖 cs.LG

← Vorige Volgende →