cs.LG papers | Gist.Science

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

Deze empirische studie toont aan dat LLM-afstemming op morele redenering geen diversiteitsbevorderende algoritmen vereist, omdat standaard RLVR-methode voor beloningsmaximalisatie even effectief zijn dankzij de geconcentreerde aard van hoogwaardige morele antwoorden.

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Dit paper introduceert het 'Gradient Flow Drifting'-framework, dat wiskundig aantoont dat het recente Drifting-model equivalent is aan een Wasserstijn-gradiëntstroom voor de forward KL-divergentie onder KDE-approximatie, en biedt een theoretisch onderbouwde strategie voor het combineren van divergenties om zowel modusinstorting als modusvervaging te voorkomen.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Dit technische artikel beschrijft een JAX-implementatie van de Self-Scaled Broyden-familie van quasi-Newton-methoden, inclusief BFGS, DFP en hun zelfgeschaalde varianten, die volledig compatibel is met de Optimistix-optimalisatiebibliotheek om de adoptie binnen de JAX-gemeenschap te vergemakkelijken.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Dit paper introduceert Geo-ATBench, een benchmark en het GeoFusion-AT-framework voor geospatiale audiotagging, die aantonen dat het integreren van geografische semantische context de nauwkeurigheid van geluherkenning verbetert, vooral bij akoestisch vergelijkbare gebeurtenissen.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

Dit artikel introduceert Conditional Expectation Reward (CER), een methode die grote taalmodellen gebruikt als impliciete verifiers om versterkingslering met verifieerbare beloningen uit te breiden naar domeinen met vrije antwoorden door een zachte, graduele beloning te bieden op basis van de waarschijnlijkheid van het genereren van een referentieantwoord.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Dit paper presenteert een nieuwe, verklaarbare aanpak om neurale netwerk-backdoors te detecteren en te elimineren door middel van actieve paden, met succesvolle experimenten in het domein van inbraakdetectie.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

Dit paper introduceert FAME, een nieuwe methode voor formele abstracte minimale verklaringen van neurale netwerken die via geavanceerde perturbatiedomeinen en LiRPA-bounds schaalbaar is naar grote netwerken terwijl het de grootte van de verklaringen verkleint en de kwaliteit kwantificeert.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Dit paper introduceert een STA-GNN-model voor onbewaakte en verklaarbare anomaliedetectie in industriële besturingssystemen, dat ruimtelijk-temporele afhankelijkheden leert, drift en valse alarmen aanpakt via conformale voorspelling, en meerdere datamodi combineert voor betrouwbare cyber-fysieke beveiliging.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Dit artikel presenteert een data-gedreven framework dat Singular Value Decomposition combineert met SHRED-neurale netwerken om de volledige magnetohydrodynamische toestand van fusie-relevante systemen nauwkeurig en efficiënt te reconstrueren op basis van slechts drie temperatuursensoren, zelfs voor niet-getrainde magnetische veldintensiteiten.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

Dit paper introduceert Contract And Conquer (CAC), een methode die via kennisdistillatie en een bewezen overdraagbaarheidsgarantie het zoekruimte voor adversariële voorbeelden in een black-box model contracteert om zo binnen een vast aantal iteraties een gegarandeerd adversariaal voorbeeld te vinden.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Dit paper introduceert EvoSchema, een uitgebreid benchmarkkader dat een nieuwe taxonomie van schema-evoluties gebruikt om de robuustheid van text-to-SQL-systemen te evalueren en te verbeteren tegenover dynamische veranderingen in databaseschema's.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

Dit paper introduceert Riemannian MeanFlow, een methode die Flow Matching uitbreidt naar Riemanniaanse variëteiten om hoogwaardige generatie in één stap mogelijk te maken door parallel transport en log-kaarten te gebruiken om de noodzaak van numerieke integratie te elimineren.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Dit artikel introduceert een efficiënt Sample-and-Search-algoritme voor het leren-versterkte k-mediane clusterprobleem in hoge dimensies, dat de computationele complexiteit en de afhankelijkheid van de dimensie aanzienlijk vermindert ten opzichte van bestaande methoden.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

Dit paper introduceert CacheSolidarity, een systeem dat timing-kantekanaal-aanvallen via automatische prefix-caching in multi-tenant LLM-systemen voorkomt door verdachte cache-deling selectief te isoleren, waardoor de prestaties en efficiëntie behouden blijven ten opzichte van bestaande, volledig isolerende verdedigingsmechanismen.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Deze studie vergelijkt Monte Carlo Dropout en Conformal Prediction voor onzekerheidsschatting in CNN's en concludeert dat GoogLeNet beter gekalibreerd is dan VGG16, terwijl Conformal Prediction statistisch gegarandeerde voorspellingen biedt die essentieel zijn voor betrouwbare AI-toepassingen.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Dit paper stelt een structurele oplossing voor datalekken in machine learning voor door een grammatica met zeven primitieven en runtime-geforceerde constraints te introduceren die selectie- en memorisatielekken effectief voorkomen, in plaats van te vertrouwen op documentatie.

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

CUPID is een plug-in framework dat ongemodificeerde, vooraf getrainde diepe netwerken in staat stelt om zowel aleatorische als epistemische onzekerheid te schatten zonder hertraining, waardoor betrouwbare en interpreteerbare AI-toepassingen in hoog-risicodomains mogelijk worden.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

Dit paper introduceert DeepRDFC, een op autoencoders gebaseerd framework dat de totale variatie-afstand tot een onbekende doelverdeling minimaliseert en zo aanzienlijke verbeteringen in communicatie-efficiëntie biedt ten opzichte van traditionele datacompressie voor willekeurige gedistribueerde functieberekening.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

Dit paper presenteert een aanpak die fysiek onkloonbare functies (PUF's) gebruikt om de gewichten van neurale netwerken te koppelen aan unieke hardware-eigenschappen, waardoor het kopiëren van deze modellen naar gekloonde hardware onmogelijk wordt gemaakt en de intellectuele eigendom effectief wordt beschermd.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

Dit artikel introduceert Sign-Prioritized FL (SP-FL), een nieuw framework voor draadloze federatielearning dat de betrouwbaarheid en nauwkeurigheid verbetert door ongelijkwaardige hulpbronnen toe te wijzen aan belangrijke gradiëntinformatie, waarbij prioriteit wordt gegeven aan het teken van de gradiënten boven de grootte.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

← Vorige Volgende →