cs.LG papers | Gist.Science

Ranking Reasoning LLMs under Test-Time Scaling

Dit paper introduceert Scorio, een open-source bibliotheek die statistische methoden biedt voor het betrouwbaar rangschikken van redeneer-LLMs onder test-time scaling, waarbij wordt aangetoond dat bepaalde technieken zelfs bij beperkte trial-aantallen nauwkeurige rankings genereren.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Deze paper introduceert een bio-geïnspireerde zelftoezicht-leerbenadering voor pols-IMU-signalen die, gebaseerd op de subbewegingstheorie, bewegingssegmenten als tokens gebruikt om robuuste representaties te leren die prestaties en data-efficiëntie bij menselijke activiteitsherkenning significant verbeteren.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Dit paper introduceert Pointy, een lichtgewicht transformer-architectuur die, ondanks training op slechts 39.000 puntwolken, concurrerende resultaten behaalt met grotere foundation modellen en de waarde benadrukt van zorgvuldig gecureerde training en architecturale keuzes.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

Dit paper introduceert TOSSS, een op CVE's gebaseerde benchmark die de veiligheid van Large Language Models evalueert door hun vermogen te meten om tussen veilige en kwetsbare codefragmenten te kiezen, waarbij geteste modellen scores tussen 0,48 en 0,89 behalen.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Dit artikel presenteert een nieuw FEDERATIEVE LEER-gebaseerd raamwerk voor B5G-netwerken dat de geheime snelheid met ongeveer 30% verbetert en eavesdroppers detecteert door middel van gecoördineerde RIS-noden en een privacy-bewust DCNN-model met vroege exit.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Dit onderzoek toont aan dat een op Graph Neural Networks gebaseerde federatieve leerbenadering, ondersteund door HAPS, superieure straalselectie biedt voor dynamische LEO-6G-netwerken vergeleken met traditionele MLP-modellen.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

Deze studie toont aan dat MLP-lagen in transformer-taalmodellen continue signalen routeren via een binaire mechanisme waarbij specifieke neuronen als 'consensus' en 'uitzonderingsbehandelaars' fungeren om te bepalen welke tokens verdere niet-lineaire verwerking nodig hebben.

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

Dit artikel introduceert een MCMC-gestuurde neurale emulator die onzekerheidskwantificering in dynamische systemen decoupeert van de netwerkarchitectuur door modelparameterverdelingen als input te gebruiken, waardoor de nauwkeurigheid van fysische modellen wordt behouden met aanzienlijk minder rekentijd.

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

Dit paper introduceert ForwardFlow, een frequentistische deep learning-methode die uitsluitend gebruikmaakt van simulaties om een neuraal netwerk te trainen dat complexe statistische inverse problemen oplost en parameters schat met eigenschappen zoals eindige steekproefnauwkeurigheid en robuustheid.

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Dit artikel introduceert een verenigd Bayes-optimalisatiekader met Gaussian processes dat minimalisatie en zadelzoektochten op potentie-energiefuncties versnelt door een uniforme zesstaps-lus, geavanceerde kernel-uitbreidingen en schaalbare random Fourier-features te combineren met pedagogische Rust-implementaties.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

Deze paper introduceert Factorized Neural Implicit DMD, een datagedreven, modelvrije methode die de spectrale decompositie van de Koopman-operator parametrisert om complexe spatiotemporale dynamica stabiel te voorspellen, te generaliseren naar nieuwe parameters en te analyseren via onderliggende modi en eigenwaarden.

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Dit artikel toont aan dat cross-species transfer learning, waarbij een op muizen getraind sequentiemodel wordt fijn afgesteld op menselijke data, de voorspellingsprestaties voor subklassen van GABA-ergerische interneuronen verbetert en de reproduceerbaarheid van de electrofysiologie-naar-transcriptomiek-mapping bevestigt.

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

Dit paper introduceert Leech Lattice Vector Quantization (LLVQ), een praktische en volledig paralleliseerbare algoritme dat de Leech-rooster gebruikt om grote taalmodellen efficiënter te comprimeren dan bestaande methoden, zonder de noodzaak van dure opslag van codeboeken.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

Het artikel introduceert V2M-Zero, een methode die video naar tijd-gealigneerde muziek vertaalt zonder gekoppelde trainingsdata, door gebruik te maken van binnen-modale gebeurteniskrommen om de gedeelde temporele structuur tussen video en muziek te benutten.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

Dit paper introduceert NeFTY, een differentieerbaar fysica-framework dat gebruikmaakt van neurale velden en een strikte numerieke solver om materialen kwantitatief in 3D te reconstrueren op basis van oppervlaktetemperatuurmetingen, waardoor de beperkingen van traditionele thermografie en bestaande PINN-benaderingen voor het detecteren van ondergrondse defecten worden overwonnen.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

XConv is een geheugen-efficiënte, drop-in vervanging voor convolutielagen die de opslag van tussenactivaties drastisch reduceert door gebruik te maken van gecomprimeerde representaties en stochastische schattingen, zonder de architectuur te beperken of significante rekenkosten toe te voegen.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

Deze survey biedt een overzicht van decentrale federatieve leermethodes tot begin 2026, classificeert ze in traditionele en blockchain-gebaseerde families, stelt een nieuwe taxonomie voor die gebaseerd is op uitdagingen, en identificeert kritieke onderzoekslacunes en toekomstige richtingen op het gebied van beveiliging, privacy en prikkels.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Deze paper overwint de beperkingen van eerdere wiskundige analyses om aan te tonen dat willekeurig geïnitieerde, polynomaal over-geparameteriseerde convolutionele neurale netwerken gestructureerde 'winnende loterijtickets' bevatten die zonder training andere netwerken kunnen benaderen.

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG

Provable Filter for Real-world Graph Clustering

Dit paper introduceert een theoretisch onderbouwde, proefbare filter voor grafclustering die zowel homofiele als heterofiele structuren in real-world grafen effectief verwerkt door het construeren van lage- en hoogdoorlaatfilters en het versterken van belangrijke kenmerken via een squeeze-and-excitation blok.

Xuanting Xie, Erlin Pan, Zhao Kang, Wenyu Chen, Bingheng Li2026-03-11🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Dit paper presenteert een diep learning-gebaseerd raamwerk dat door gezamenlijke ontdekking van coördinaten en stroomkaarten de computationele efficiëntie van multischaal-systemen verbetert met state-of-the-art voorspellende nauwkeurigheid en lagere kosten.

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid Bazaz2026-03-11🤖 cs.LG

← Vorige Volgende →