cs.LG papers | Gist.Science

Some Super-approximation Rates of ReLU Neural Networks for Korobov Functions

Dit artikel toont aan dat ReLU-neurale netwerken Korobov-functies kunnen benaderen met super-optimale fouten van de orde $2m$ in de $L_p$ -norm en $2m-2$ in de $W^1_p$ -norm, waarbij de expressiviteit grotendeels vrij blijft van de vervloeking van de dimensionaliteit dankzij het gebruik van schaarse roostervaste elementen en bit-extractie.

Yuwen Li, Guozhi Zhang2026-03-06💻 cs

Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games

Deze paper introduceert een kernel-gebaseerde maximum-entropie methode voor inverse versterkingsleer in oneindige-horizont stationaire mean-field games die niet-lineaire beloningsstructuren kan infereren, en biedt tevens een alternatief convergentie-algoritme voor eindige-horizont niet-stationaire scenario's.

Berkay Anahtarci, Can Deha Kariksiz, Naci Saldi2026-03-06🔢 math

Elucidating the Design Space of Arbitrary-Noise-Based Diffusion Models

Deze paper introduceert EDA, een nieuw theoretisch kader dat het ontwerpruimte van diffusiemodellen uitbreidt naar willekeurige ruispatronen om de herstelafstand te minimaliseren en zo superieure prestaties te leveren bij diverse medische en natuurlijke beeldhersteltaken met slechts vijf steekproefstappen.

Xingyu Qiu, Mengying Yang, Xinghua Ma + 6 more2026-03-06💻 cs

Structured quantum learning via em algorithm for Boltzmann machines

Deze paper introduceert een kwantumversie van de EM-algoritme voor het trainen van kwantum-Boltzmannmachines, waarmee het probleem van verdwijnende gradiënten wordt omzeild en stabielere, schaalbare generatieve modellering wordt bereikt.

Takeshi Kimura, Kohtaro Kato, Masahito Hayashi2026-03-06⚛️ quant-ph

TIC-GRPO: Provable and Efficient Optimization for Reinforcement Learning from Human Feedback

Dit paper introduceert TIC-GRPO, een verbeterd, critic-vrij algoritme voor Reinforcement Learning from Human Feedback dat de convergentie en prestaties van GRPO verbetert door token-level importance sampling te vervangen door een traject-level correctie, terwijl het theoretisch bewijst dat de oorspronkelijke GRPO-update een verwaarloosbare bias introduceert.

Lei Pang, Jun Luo, Ruinan Jin2026-03-06💻 cs

Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection

Deze studie biedt een betrouwbaar evaluatiekader voor geautomatiseerde detectie van neonatale epileptische aanvallen door aan te tonen dat bestaande methoden vaak vertekend zijn en door aanbevelingen te doen voor het gebruik van gebalanceerde metrics, uitgebreide prestatie-indicatoren en een multi-rater Turing-test om AI-prestaties eerlijk te vergelijken met die van experts.

Jovana Kljajic, John M. O'Toole, Robert Hogan + 1 more2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

Dit paper presenteert een systematische studie naar praktische in-training-maatregelen om emergente misalignatie in taalmodellen tijdens fine-tuning via API's te voorkomen, waarbij blijkt dat het interleaveen van trainingsdata op basis van een perplexiteitskloof de meest effectieve aanpak is.

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs

Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings

Dit onderzoek toont aan dat de rangschikkingen van grote taalmodellen, zoals die op Chatbot Arena, uiterst gevoelig zijn voor het verwijderen van een verwaarloosbaar klein percentage van de voorkeursdata, waardoor de top van de lijst kan veranderen, terwijl rangschikkingen gebaseerd op MT-bench door deskundige annotatoren aanzienlijk robuuster blijken.

Jenny Y. Huang, Yunyi Shen, Dennis Wei + 1 more2026-03-06💻 cs

How Quantization Shapes Bias in Large Language Models

Deze studie toont aan dat kwantisatie van grote taalmodellen de toxiciteit kan verminderen maar tegelijkertijd stereotypen en onrechtvaardigheid in generatieve taken licht verhoogt, wat de noodzaak benadrukt om efficiëntie en ethische overwegingen zorgvuldig in evenwicht te brengen.

Federico Marcuzzi, Xuefei Ning, Roy Schwartz + 1 more2026-03-06💻 cs

Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey

Dit overzichtspaper presenteert een gestructureerde taxonomie van Multi-Agent Reinforcement Learning-toepassingen in intelligente vervoerssystemen, bespreekt de belangrijkste simulatieplatforms en identificeert de uitdagingen die de implementatie in de praktijk belemmeren.

Rexcharles Donatus, Kumater Ter, Daniel Udekwe2026-03-06💻 cs

A Geometric Perspective on the Difficulties of Learning GNN-based SAT Solvers

Dit artikel legt uit dat de prestaties van GNN-gebaseerde SAT-oplossers op moeilijke instanties verslechteren door oversquashing, veroorzaakt door de inherente negatieve kromming van de bijbehorende bipartiete grafen, en toont aan dat deze kromming een sterke voorspeller is voor complexiteit en generalisatiefouten.

Geri Skenderi2026-03-06🔬 physics

New Insights into Optimal Alignment of Acoustic and Linguistic Representations for Knowledge Transfer in ASR

Deze paper introduceert een nieuw inzicht dat alignatie als detectieprobleem bekijkt en een onbalans-gebaseerd optimal transport-model voorstelt om de overdracht van taalkennis in spraakherkenning te verbeteren door structurele asymmetrieën en ruis effectief te hanteren.

Xugang Lu, Peng Shen, Hisashi Kawai2026-03-06💻 cs

AttnBoost: Retail Supply Chain Sales Insights via Gradient Boosting Perspective

Dit paper introduceert AttnBoost, een interpreteerbaar leerframework dat feature-level attention integreert in het boosting-proces om de voorspellingsnauwkeurigheid en inzichtelijkheid van retailverkoopdata te verbeteren.

Yadi Liu, Xiaoli Ma, Muxin Ge + 6 more2026-03-06💻 cs

Topology Structure Optimization of Reservoirs Using GLMY Homology

Dit artikel introduceert een methode om de prestaties van reservoirs te optimaliseren door hun topologische structuur te analyseren en te verbeteren met behulp van persistente GLMY-homologie, waarbij wordt aangetoond dat de prestaties worden bepaald door de interactie tussen de structuur en de periodiciteit van de dataset.

Yu Chen, Shengwei Wang, Hongwei Lin2026-03-06💻 cs

TabStruct: Measuring Structural Fidelity of Tabular Data

Deze paper introduceert TabStruct, een uitgebreid evaluatiekader met de nieuwe 'global utility'-metriek om de structurele betrouwbaarheid van synthetische tabulaire data te beoordelen zonder afhankelijk te zijn van grondwaarheid causale structuren, en presenteert een benchmark met resultaten van 13 generatoren over 29 datasets.

Xiangjian Jiang, Nikola Simidjievski, Mateja Jamnik2026-03-06💻 cs

BabyHuBERT: Multilingual Self-Supervised Learning for Segmenting Speakers in Child-Centered Long-Form Recordings

Dit paper introduceert BabyHuBERT, een meertalig zelftoezichtend spraakmodel getraind op 13.000 uur aan kinderopnames dat aanzienlijk beter presteert dan bestaande modellen bij het segmenteren van sprekers in daglange, natuurlijke kinderopnames.

Théo Charlot, Tarek Kunze, Maxime Poli + 3 more2026-03-06💻 cs

Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks

Dit artikel introduceert Diffusion-Based Impedance Learning, een raamwerk dat generatieve modellen combineert met energie-consistente impedantiebesturing om robots in staat te stellen contactrijke taken zoals het invoegen van pennen in gaten met hoge precisie en succes te voltooien.

Noah Geiger, Tamim Asfour, Neville Hogan + 1 more2026-03-06💻 cs

Complexity-Regularized Proximal Policy Optimization

Deze paper introduceert CR-PPO, een verbeterde versie van Proximal Policy Optimization die in plaats van standaard entropieregulering een zelfregulerende complexieterm gebruikt om de balans tussen orde en willekeur te bewaken, wat resulteert in robuustere prestaties en minder afhankelijkheid van kostbare hyperparameter-tuning.

Luca Serfilippi, Giorgio Franceschelli, Antonio Corradi + 1 more2026-03-06💻 cs

Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription

Dit paper introduceert Noise-to-Notes (N2N), een generatief diffusion-framework dat automatisch drumtranscriptie herdefinieert als een conditionele generatieve taak en door middel van een Annealed Pseudo-Huber loss en features van muziek-foundationmodellen nieuwe state-of-the-art prestaties bereikt.

Michael Yeung, Keisuke Toyama, Toya Teramoto + 2 more2026-03-06💻 cs

BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

BridgeDrive is een nieuwe, theoretisch consistente anchor-geleide diffusie-brugpolitiek voor gesloten-lus trajectplanning in autonoom rijden die de prestaties op de Bench2Drive-benchmark aanzienlijk verbetert door ruwe ankertrajecten direct om te zetten in verfijnde, contextbewuste plannen.

Shu Liu, Wenlin Chen, Weihao Li + 7 more2026-03-06💻 cs

← Vorige Volgende →