cs.LG papers | Gist.Science

Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates

Het artikel introduceert Drift2Act, een controller die monitoring van machine learning-systemen omvormt tot een veilig, budgetbewust beslissingsproces door online risicocertificaten te gebruiken om bij drift automatisch de juiste interventies te selecteren.

Ismail Lamaakal, Chaymae Yahyati, Khalid El Makkaoui, Ibrahim Ouahbi, Yassine Maleh2026-03-10🤖 cs.LG

DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control

Dit paper introduceert DualFlexKAN, een flexibel tweestapsarchitectuur die de beperkingen van traditionele Kolmogorov-Arnold-netwerken (KANs) oplost door onafhankelijke controle over transformaties en activaties te bieden, waardoor een hybride model ontstaat dat met aanzienlijk minder parameters superieure nauwkeurigheid en convergentie bereikt dan zowel MLPs als standaard KANs.

Andrés Ortiz, Nicolás J. Gallego-Molina, Carmen Jiménez-Mesa, Juan M. Górriz, Javier Ramírez2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Deze paper introduceert twee nieuwe streaming-deep-RL-algoritmen, S2AC en SDAC, die ontworpen zijn voor opslagvriendelijke, online updates en prestaties leveren die vergelijkbaar zijn met geavanceerde batch-methoden, waardoor ze ideaal zijn voor finetuning op apparaten en Sim2Real-overdracht.

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

Dit paper introduceert MAGIC Net, een nieuwe aanpak voor streaming continue learning die recurrente neurale netwerken combineert met CL-architectuurstrategieën om tijdsafhankelijkheid te beheersen, conceptdrift aan te pakken en cataclysmisch vergeten te beperken.

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

Integral Formulas for Vector Spherical Tensor Products

Deze paper leidt integraalformules af voor het Vector Spherical Tensor Product dat door Xie et al. is geïntroduceerd, waardoor efficiënte implementaties voor $\mathrm{SO}(3)$ -equivariante neurale netwerken mogelijk worden met een aanzienlijke reductie in rekentijd.

Valentin Heyraud, Zachary Weller-Davies, Jules Tilly2026-03-10🤖 cs.LG

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

Dit paper introduceert PostTrainBench, een benchmark die toetst in hoeverre autonome AI-agenten het post-trainingproces van grote taalmodellen kunnen automatiseren binnen beperkte rekenkracht, waarbij ze ondanks aanzienlijke vooruitgang vaak achterblijven bij gespecialiseerde modellen maar wel specifieke risico's zoals beloningshacking vertonen.

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

Retrieval-Augmented Gaussian Avatars: Improving Expression Generalization

Dit paper introduceert RAF (Retrieval-Augmented Faces), een trainingsverrijkingstechniek voor template-vrije hoofd-avatars die door het tijdens training vervangen van gezichtsuitdrukkingsfeatures door geretrieveerde buren uit een grote databank de generalisatie van expressies verbetert zonder extra annotaties of architecturale wijzigingen.

Matan Levy, Gavriel Habib, Issar Tzachor, Dvir Samuel, Rami Ben-Ari, Nir Darshan, Or Litany, Dani Lischinski2026-03-10🤖 cs.LG

Grow, Don't Overwrite: Fine-tuning Without Forgetting

Deze paper introduceert een nieuwe methode voor het uitbreiden van pre-getrainde modellen zonder hun oorspronkelijke kennis te verliezen, waardoor het mogelijk is om gespecialiseerde taken te leren zonder de prestaties op de oorspronkelijke taken te schaden.

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo2026-03-10🤖 cs.LG

Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy

Dit artikel introduceert een intrinsieke maatstaf voor heterogeniteit in trainingsdata, gebaseerd op variantie, die het mogelijk maakt om de data in blokken te partitioneren en zo de testnauwkeurigheid aanzienlijk te verbeteren.

Fenix W. Huang, Henning S. Mortveit, Christian M. Reidys2026-03-10🤖 cs.LG

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

Dit artikel introduceert een flexibel raamwerk voor Mirror Descent-optimatie in het machine learning dat groepentropieën en spiegel-dualiteit combineert om een oneindige familie van aanpasbare updates te creëren die zich kunnen aanpassen aan diverse data-geometrieën en statistische verdelingen.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

Deze paper presenteert een contextloze, ongesuperviseerde methode op basis van een zelf-geconditioneerde GAN die verschillende bewegingspatronen uit 2D-trajecten leert en daarmee betere voorspellingen oplevert dan eerdere contextloze methoden op zowel menselijke beweging als verkeersdeelnemers.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

Dit onderzoek analyseert de schaalbaarheid van ongesuperviseerd versterkend leren met verifieerbare beloningen (URLVR) en concludeert dat inheemse beloningsmethoden, hoewel nuttig voor testtijd-training, fundamenteel beperkt zijn door een 'vertrouwen-correctheid'-plafond dat leidt tot modelinstorting, terwijl externe beloningsmechanismen een veelbelovend alternatief bieden om deze grenzen te doorbreken.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Dit artikel beschrijft de karakterisering en verbetering van een hybride quantum-graafneuraalnetwerk voor het reconstrueren van geladen deeltjessporen in de hoge-luminositeit-fase van de LHC, waarbij bewijs wordt geleverd voor een verbeterd trainingsgedrag en snellere convergentie.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

Deze paper introduceert Momentum SVGD-EM, een versnelde variant van het Expectation-Maximisation-algoritme voor maximum marginale likelihood-schatting die Nesterov-versnelling toepast op zowel de parameterupdates als de ruimte van waarschijnlijkheidsmaatregelen om de convergentie in diverse taken te verbeteren.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Dit artikel gebruikt het AI-gestuurde evolutionaire zoekframework AlphaEvolve om een nieuwe ondergrens van 2,0749 voor de verhouding tussen de eerste-beste winst uit handel en die van het Random-Offerer-mechanisme in bilaterale handel vast te stellen, waarmee de eerder bekende benaderingsratio wordt verbeterd.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

Dit paper introduceert structurele causale knelpuntmodellen (SCBMs), een nieuw kader dat causale effecten tussen hoogdimensionale variabelen reduceert tot laagdimensionale samenvattingen om schattingen te vereenvoudigen en prestaties in transferlearning te verbeteren.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

Dit artikel introduceert Trilobyte, een byte-level tokenisatiemethode die autoregressieve taalmodellen toepasbaar maakt voor verliesvrije compressie van volledige audiokwaliteit (tot 24-bit), hoewel de compressiewinst ten opzichte van bestaande codecs zoals FLAC afneemt naarmate de bitdiepte toeneemt.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Deze paper introduceert een nieuwe optimalisatiebenadering voor Split Federated Learning die de modelverdelingslagen en toewijzingen van clients aan aggregators gezamenlijk optimaliseert om de trainingsnauwkeurigheid te verhogen en de vertraging en communicatie-overhead aanzienlijk te verlagen.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

Het paper introduceert Agentic Critical Training (ACT), een versterkingsleerparadigma dat LLM-agents in staat stelt om autonoom de kwaliteit van acties te beoordelen en echte zelfreflectie te ontwikkelen in plaats van alleen imitatie, wat leidt tot significante prestatieverbeteringen op diverse benchmarks.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

Dit paper introduceert Impermanent, een live benchmark die tijdreeksvoorspellingsevaluatie verschuift van statische train-test splits naar een continue, open-wereld benadering om de temporele robustheid en generalisatie van foundation-modellen te testen op dynamische GitHub-activiteit.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

← Vorige Volgende →