cs.LG papers | Gist.Science

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Dit artikel introduceert een uitgebreid benchmarkkader voor multi-agent reinforcement learning in de CityLearn-omgeving, waarbij wordt vastgesteld dat decentrale training en uitvoering (DTDE) samen met tijdsafhankelijk leren superieure prestaties leveren op diverse duurzaamheids- en robuustheidskpi's voor stedelijke energiesystemen.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude Formanek2026-03-10🤖 cs.LG

RAmmStein: Regime Adaptation in Mean-reverting Markets with Stein Thresholds -- Optimal Impulse Control in Concentrated AMMs

Dit paper introduceert RAmmStein, een Deep Reinforcement Learning-methode die het optimale moment voor herbalancering in geconcentreerde liquiditeitsmarkten bepaalt door marktdynamieken te combineren met kostenbewustzijn, waardoor de winstgevendheid aanzienlijk wordt verhoogd ten opzichte van traditionele strategieën.

Pranay Anchuri2026-03-10🤖 cs.LG

Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis

Deze studie presenteert een systematische benchmarking van vier GNN-architecturen voor moleculaire regressie, waarbij een hiërarchisch fusieframework (GNN+FP) consistent betere prestaties levert dan standalone modellen en waarbij Centered Kernel Alignment (CKA) analyse aantoont dat GNN- en fingerprint-embeddings in sterk onafhankelijke latente ruimtes opereren.

Rajan, Ishaan Gupta2026-03-10🤖 cs.LG

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

Deze paper introduceert MrBERT, een familie van moderne meertalige encodermodellen die door middel van vocabulaire-, domein- en dimensionale aanpassing, inclusief Matryoshka Representation Learning, state-of-the-art prestaties bereikt op Catalaanse en Spaanse taken en gespecialiseerde domeinen zoals biomedische en juridische toepassingen.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

Autoregressive Visual Decoding from EEG Signals

Dit paper introduceert AVDE, een lichtgewicht en efficiënt autoregressief framework dat EEG-signalen gebruikt om beelden te decoderen door LaBraM en een multi-scale token-predictiestrategie te combineren, waardoor het de prestaties van bestaande methoden verbetert met slechts 10% van de parameters.

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Dit paper introduceert CeRA, een parameter-efficiënte fine-tuning-methode die door middel van SiLU-gating en structurele dropout de lineaire beperkingen van LoRA doorbreekt en zo superieure prestaties bereikt op complexe redeneertaken door de dormantie van het singuliere waarden-spectrum te activeren.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Dit paper beschrijft hoe het gebruik van een gespecialiseerd, fijngefineerd LLM om schaalbare tekstuele relevantielabels te genereren, de App Store-rangschikking verbetert door zowel gedrags- als tekstuele relevantie te optimaliseren, wat resulteert in een statistisch significant toename van de conversie, vooral voor zeldzame zoekopdrachten.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

End-to-end Differentiable Calibration and Reconstruction for Optical Particle Detectors

Deze paper introduceert de eerste volledig differentieerbare simulator voor optische deeltjesdetectoren die calibratie en reconstructie verenigt in één raamwerk, waardoor bestaande analysepijplijnen worden vereenvoudigd en de nauwkeurigheid en snelheid worden verbeterd.

Omar Alterkait, César Jesús-Valls, Ryo Matsumoto, Patrick de Perio, Kazuhiro Terao2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

Dit paper introduceert Attn-QAT, een kwantiseringsbewuste trainingsmethode die stabiele 4-bit attention mogelijk maakt op FP4-GPU's door de backward pass aan te passen, waardoor de kwaliteit van modellen behouden blijft en er tot 1,5x snelheidswinst wordt geboekt.

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

The Partition Principle Revisited: Non-Equal Volume Designs Achieve Minimal Expected Star Discrepancy

Dit artikel introduceert een nieuwe klasse van partities met ongelijke volumes die, volgens een bewezen verdelingsprincipe, een lagere verwachte ster-discrepantie opleveren dan klassieke jittered sampling en daarmee een theoretische basis vormen voor hoogdimensionale numerieke integratie.

Xiaoda Xu2026-03-10🤖 cs.LG

How Well Do Multimodal Models Reason on ECG Signals?

Deze paper introduceert een reproduceerbaar kader voor het evalueren van het redeneervermogen van multimodale modellen op ECG-signalen door het redeneren te ontleden in perceptie en deductie, waarbij respectievelijk code-generatie en een klinische criteria-database worden gebruikt voor schaalbare en semantisch accurate verificatie.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Dit paper presenteert een tweelaags HMM-POMDP-raamwerk dat, door rivaliserende auto's' verborgen energiestatus te infereren uit waarneembare telemetrie, de optimale energie-inzetstrategie voor de 2026 Formule 1-reglementen bepaalt en valstrikken zoals de 'counter-harvest trap' effectief detecteert.

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

TCG CREST System Description for the DISPLACE-M Challenge

Dit rapport beschrijft het TCG CREST-systeem voor de DISPLACE-M-uitdaging, waarbij een hybride end-to-end neurale diarizatie-architectuur (Diarizen) met geavanceerde clusteringtechnieken een relatieve verbetering van 39% in de diarizatiefout (DER) oplevert ten opzichte van een SpeechBrain-baseline en de zesde plaats behaalt onder de deelnemende teams.

Nikhil Raghav, Md Sahidullah2026-03-10🤖 cs.LG

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

Dit paper introduceert een detectie-gestuurde pipeline die robuuste glottale segmentatie en klinische pathologie-evaluatie mogelijk maakt door een lokale detector te combineren met een segmentatiemodel, waardoor state-of-the-art prestaties en cross-dataset generalisatie worden bereikt voor real-time klinisch gebruik.

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

Dit artikel presenteert een robuust classificatiekader voor beelden van het immaterieel cultureel erfgoed in de Mekongdelta, waarbij de CoAtNet-architectuur wordt gecombineerd met modelsoepen om de generalisatie te verbeteren door de variantie te verminderen in een data-schaarste omgeving.

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Personalized Multi-Agent Average Reward TD-Learning via Joint Linear Approximation

Dit artikel presenteert een gepersonaliseerd multi-agent TD-leringsframework dat via gezamenlijke lineaire benadering en schatting van een gedeelde ondergrondse ruimte de convergentie garandeert, conflicterende signalen filtert en lineaire snelheidswinst bereikt ondanks heterogeniteit en Markoviaanse bemonstering.

Leo Muxing Wang, Pengkun Yang, Lili Su2026-03-10🤖 cs.LG

Embedding interpretable $\ell_1$ -regression into neural networks for uncovering temporal structure in cell imaging

Deze paper stelt een hybride architectuur voor die een interpreteerbare $\ell_1$ -geregulariseerde vector autoregressieve (VAR) regressie in een convolutionele autoencoder integreert om de tijdsafhankelijke dynamiek en ruimtelijke bijdragen in tweefoton-calciumbeeldvorming van cellen effectief en transparant te ontrafelen.

Fabian Kabus, Maren Hackenberg, Julia Hindel, Thibault Cholvin, Antje Kilias, Thomas Brox, Abhinav Valada, Marlene Bartos, Harald Binder2026-03-10🤖 cs.LG

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Deze paper introduceert GramCol en een Interpretable Motion-Attentive Map (IMAP) om zonder gradiëntberekening ruimtelijk en temporeel te lokaliseren hoe Video Diffusion Transformers bewegingsconcepten vertalen naar video's.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

Dit paper introduceert CGL, een continu leerframework voor GUI-agenten dat Supervised Fine-Tuning en Reinforcement Learning dynamisch combineert via een entropie-gestuurde aanpassing en een gradiëntchirurgie-strategie om aanpassing aan nieuwe taken te bevorderen zonder oude kennis te vergeten, wat wordt gevalideerd op het nieuwe AndroidControl-CL-benchmark.

Zhenquan Yao, Zitong Huang, Yihan Zeng, Jianhua Han, Hang Xu, Chun-Mei Feng, Jianwei Ma, Wangmeng Zuo2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Dit paper biedt de eerste theoretische scheiding tussen Adam en SGD door aan te tonen dat de tweede-momentnormalisatie in Adam zorgt voor een scherpere staart in de convergentie, met een afhankelijkheid van $\delta^{-1/2}$ in plaats van de noodzakelijke $\delta^{-1}$ bij SGD.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

← Vorige Volgende →

cs.LG