cs.LG papers | Gist.Science

How Far Can Unsupervised RLVR Scale LLM Training?

Dit onderzoek analyseert de schaalbaarheid van ongesuperviseerd versterkend leren met verifieerbare beloningen (URLVR) en concludeert dat inheemse beloningsmethoden, hoewel nuttig voor testtijd-training, fundamenteel beperkt zijn door een 'vertrouwen-correctheid'-plafond dat leidt tot modelinstorting, terwijl externe beloningsmechanismen een veelbelovend alternatief bieden om deze grenzen te doorbreken.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Dit artikel beschrijft de karakterisering en verbetering van een hybride quantum-graafneuraalnetwerk voor het reconstrueren van geladen deeltjessporen in de hoge-luminositeit-fase van de LHC, waarbij bewijs wordt geleverd voor een verbeterd trainingsgedrag en snellere convergentie.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Deze paper introduceert Momentum SVGD-EM, een versnelde variant van het Expectation-Maximisation-algoritme voor maximum marginale likelihood-schatting die Nesterov-versnelling toepast op zowel de parameterupdates als de ruimte van waarschijnlijkheidsmaatregelen om de convergentie in diverse taken te verbeteren.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Dit artikel gebruikt het AI-gestuurde evolutionaire zoekframework AlphaEvolve om een nieuwe ondergrens van 2,0749 voor de verhouding tussen de eerste-beste winst uit handel en die van het Random-Offerer-mechanisme in bilaterale handel vast te stellen, waarmee de eerder bekende benaderingsratio wordt verbeterd.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

Dit paper introduceert structurele causale knelpuntmodellen (SCBMs), een nieuw kader dat causale effecten tussen hoogdimensionale variabelen reduceert tot laagdimensionale samenvattingen om schattingen te vereenvoudigen en prestaties in transferlearning te verbeteren.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

Dit artikel introduceert Trilobyte, een byte-level tokenisatiemethode die autoregressieve taalmodellen toepasbaar maakt voor verliesvrije compressie van volledige audiokwaliteit (tot 24-bit), hoewel de compressiewinst ten opzichte van bestaande codecs zoals FLAC afneemt naarmate de bitdiepte toeneemt.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Deze paper introduceert een nieuwe optimalisatiebenadering voor Split Federated Learning die de modelverdelingslagen en toewijzingen van clients aan aggregators gezamenlijk optimaliseert om de trainingsnauwkeurigheid te verhogen en de vertraging en communicatie-overhead aanzienlijk te verlagen.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

Het paper introduceert Agentic Critical Training (ACT), een versterkingsleerparadigma dat LLM-agents in staat stelt om autonoom de kwaliteit van acties te beoordelen en echte zelfreflectie te ontwikkelen in plaats van alleen imitatie, wat leidt tot significante prestatieverbeteringen op diverse benchmarks.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

Dit paper introduceert Impermanent, een live benchmark die tijdreeksvoorspellingsevaluatie verschuift van statische train-test splits naar een continue, open-wereld benadering om de temporele robustheid en generalisatie van foundation-modellen te testen op dynamische GitHub-activiteit.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

Dit artikel presenteert een mixed-frequency benadering om het Meese-Rogoff-probleem op te lossen en de voorspellingskracht van wisselkoersen (CAD/USD) te verbeteren door informatieverlies door temporele aggregatie te voorkomen.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Deze paper presenteert een interpreteerbaar kader voor het classificeren van foetale ultrasone beelden dat gebruikmaakt van medische concepten en een concept-gebaseerde GCN om de beslissingsprocessen van diepe neurale netwerken transparant en klinisch begrijpelijk te maken.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

Dit artikel presenteert een neurale netwerkmodel dat de sterke correlatie tussen COVID-19 en dengue aantoont en een LSTM-benadering gebruikt om dengue-uitbraken in landen met onvoldoende data te voorspellen op basis van COVID-19-statistieken.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

Dit artikel presenteert een schaalbaar en robuust algoritme voor snelle toestandsschatting in elektriciteitsnetwerken met behulp van Graph Neural Networks op factorgrafen, dat nauwkeurige resultaten levert en resistent is tegen lokale storingen van PMU's.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

Dit artikel introduceert Ancestral GFlowNet (AGFN), een nieuw algoritme dat causale ontdekking onder latent verstorende factoren combineert met zowel voorafgaande als onzekere expertkennis via een Bayesiaanse versterkende leerbenadering, waarbij bewezen wordt dat het convergeert naar het ware causale model.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

Dit artikel introduceert een unificerend raamwerk voor het leren van objecten uit willekeurige lineaire metingen met behulp van niet-lineaire modellen, waarbij nieuwe generalisatiegrenzen worden afgeleid die de benodigde hoeveelheid data relateren aan de structurele eigenschappen van het model en de interactie met het meetproces.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Dit paper leidt theoretische ondergrenzen af voor de energie-efficiëntie van ideale neuromorfe leer-in-geheugen-optimizers door de thermodynamica van niet-evenwichtsleren te modelleren, waarbij de energiebarrières van fysieke geheugenelementen worden afgestemd op de dynamiek van optimalisatie en consolidatie.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Deze paper introduceert een pose-bewust in-context visueel leersysteem (PA-ICVL) voor Vision-Language Models dat de detectie van semantische structurele hallucinaties in cartoon-afbeeldingen aanzienlijk verbetert door naast RGB-beelden ook pose-informatie te gebruiken.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

Deze paper introduceert BInD, een diffusiemodel dat gelijktijdig moleculen en hun interacties met een doelwit-eiwit genereert om een evenwichtige optimalisatie van meerdere doelen in structurele geneesmiddelenontwerp te bereiken.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Dit artikel introduceert een innovatief tweestaps actief leerproces voor spraakherkenning dat onbewaakte x-vector-clustering combineert met een bewaakte Bayesiaanse batch-methode om de labelinspanning aanzienlijk te reduceren terwijl de prestaties op diverse testsets worden geoptimaliseerd.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Dit artikel biedt een uitgebreide review en formele specificatie van voorspellende coderingsnetwerken, een neurobiologisch geïnspireerd raamwerk dat gebruikmaakt van inferentie-leren in plaats van backpropagatie en dat zowel voor toezicht als voor generatieve modellering een veelbelovende basis vormt voor toekomstige innovaties in machine learning.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

← Vorige Volgende →