cs.LG papers | Gist.Science

Stabilizing Reinforcement Learning for Diffusion Language Models

Deze paper introduceert StableDRL, een gestabiliseerde variant van Group Relative Policy Optimization (GRPO) die specifiek is ontworpen om reward collapse te voorkomen bij het toepassen van versterkingslering op diffusie-taalmodellen door onbetrouwbare schattingen van waarschijnlijkheidsverhoudingen aan te pakken via onvoorwaardelijke clipping en zelf-normalisatie.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

Dit paper introduceert DIRECTER, een nieuwe activatiesturingstechniek die dynamisch de stuurkracht aanpast op basis van plausibiliteit en een eenmalige attentie-analyse om de instructievolgingscapaciteit van grote taalmodellen te verbeteren zonder de kwaliteit van de gegenereerde tekst te schaden.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

In dit paper wordt ProtAlign geïntroduceerd, een multi-objectief voorkeursuitlijningsframework dat voorgeöefende inverse vouwmodellen fijnstelt om diverse ontwikkelbaarheidseigenschappen te optimaliseren zonder de structurele integriteit te schaden, wat resulteert in het model MoMPNN dat een verbeterde balans biedt tussen ontvouwbaarheid en ontwikkelbaarheid.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Deze paper introduceert de LAE-EnKF, een nieuwe data-assimilatiemethode die de beperkingen van de standaard Ensemble Kalman-filter bij sterk niet-lineaire systemen oplost door assimilatie uit te voeren in een geleerde, stabiele lineaire latente ruimte.

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

Dit paper introduceert een hybride quantum-klassiek autoencoder- en variational autoencoder-model dat gebruikmaakt van quantum impliciete neurale representaties (QINR) om beeldreconstructie en -generatie te verbeteren door rijke, hoogfrequente kenmerken te genereren en de stabiliteit en diversiteit ten opzichte van bestaande quantum generatieve modellen te vergroten.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Deze paper introduceert ICD3, een nieuwe aanpak voor het detecteren van conceptdrift in onevenwichtige stromende data die het 'maskeringseffect' van grote clusters omzeilt door onbevooroordeelde clusterbeschrijvers te gebruiken om drift in kleine concepten nauwkeurig en interpreteerbaar te lokaliseren.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Dit paper introduceert een multi-niveau framework om de robuustheid en consistentie van SHAP-verklaringen voor diagnostische en prognostische machine learning-modellen bij Alzheimer te valideren, waarbij wordt aangetoond dat cognitieve en functionele markers stabiel blijven over verschillende ziektestadia en modelarchitecturen heen.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Dit paper introduceert een diversiteitsbewuste, adaptieve selectiemethode voor collocatiepunten in Physics-Informed Neural Networks (PINNs) die het probleem omzet in een sparse QUBO-optimalisatie met hybride coreset-anchors, waardoor de trainingskosten worden verlaagd en de nauwkeurigheid voor PDE's zoals de viskeuze Burgers-vergelijking wordt verbeterd.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

Deze studie toont aan dat Fourier Neural Operators (FNO) een sneller en nauwkeuriger alternatief bieden voor traditionele CFD-methoden bij het voorspellen van stationaire stroming door poreuze media, wat de topologie-optimalisatie van koudplaten aanzienlijk versnelt.

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

Dit paper presenteert een meta-learning architectie met graph convolutional neural networks die het mogelijk maakt om verkeersstromen snel en nauwkeurig te voorspellen in onbekende netwerksituaties, zoals bij infrastructuurstoringen of veranderingen in de vraag, zonder dat een uitgebreide trainingsdataset voor elk specifiek scenario nodig is.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Dit artikel toont aan dat symbolisch machine learning, in tegenstelling tot minder interpreteerbare neurale netwerken, effectief en uitlegbaar faaldetectie kan uitvoeren in chemische processen zoals ethyleenoxidatie, zelfs wanneer het trainen gebeurt op gesimuleerde data vanwege het gebrek aan historische real-world foutgegevens.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

Gauge Freedom and Metric Dependence in Neural Representation Spaces

Deze paper toont aan dat neurale representaties een meetkundige vrijheidsgraad hebben onder lineaire transformaties, waardoor veelgebruikte vergelijkingsmaten zoals cosinus-achtigheid afhankelijk worden van de gekozen coördinaten en niet-invariant zijn voor de daadwerkelijke modelfunctie.

Jericho Cain2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Dit artikel introduceert HGT-Scheduler, een deep reinforcement learning framework dat het Job Shop Scheduling Problem modelleert als een heterogeen graf met een Heterogeneous Graph Transformer om type-specifieke relaties te benutten, wat leidt tot statistisch significant betere resultaten dan homogene grafbenaderingen.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

Het artikel introduceert SpatialMAGIC, een hybride framework dat graf-diffusie en ruimtelijke zelf-attention combineert om de hoge mate van sparsiteit en technische ruis in ruimtelijke transcriptomics-data te overwinnen, waardoor de imputatie van genexpressie en de daaropvolgende biologische analyses significant worden verbeterd.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Dit paper introduceert xaitimesynth, een open-source Python-pakket dat herbruikbare infrastructuur biedt voor het evalueren van attributiemethoden voor tijdreeksen door synthetische data met bekende grondwahrheid te genereren en standaard localisatiemetrieken te implementeren.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Dit artikel presenteert een door natuurkunde geïnspireerd diffusiemodel op basis van Context-UNet dat synthetische, fysisch consistente multi-spectrale satellietbeelden van zeldzame extreme weersomstandigheden genereert om het datatekort bij het detecteren van snel intensiverende tropische cyclonen te verhelpen.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

Dit paper introduceert Optimistic Policy Regularization (OPR), een lichtgewicht methode die de sample-efficiëntie en prestaties van deep reinforcement learning verbetert door het beleid te regulariseren op basis van een dynamische buffer van historisch succesvolle trajecten, wat resulteert in superieure resultaten op Atari-spellen en de CAGE Challenge 2-cyberverdediging.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Dit paper introduceert Best-of-Tails (BoT), een adaptief raamwerk dat de trade-off tussen optimisme en pessimisme bij inferentie-tijd uitlijning van grote taalmodellen oplost door de zwaarte van de beloningsverdeling te analyseren en dynamisch de selectiestrategie aan te passen om zo de prestaties te maximaliseren.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Het paper introduceert NEST, een framework voor device placement in gedistribueerd deep learning dat via gestructureerde dynamische programmering parallelisme, netwerktopologie en geheugenbeperkingen gezamenlijk optimaliseert, wat resulteert in aanzienlijk hogere doorvoer en schaalbaarheid vergeleken met bestaande methoden.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Multi-Agent Reinforcement Learning with Submodular Reward

Dit artikel introduceert het eerste formele kader voor cooperatief multi-agent reinforcement learning met submodulaire beloningen, waarbij algoritmen worden ontwikkeld die wiskundige garanties bieden op sample-efficiëntie en spijt, inclusief een polynoom-complexiteit benadering voor bekende dynamica en een UCB-gebaseerde leeralgoritme voor onbekende dynamica.

Wenjing Chen, Chengyuan Qian, Shuo Xing, Yi Zhou, Victoria Crawford2026-03-10🤖 cs.LG

← Vorige Volgende →