cs.LG papers | Gist.Science

Recurrent Graph Neural Networks and Arithmetic Circuits

Dit artikel vestigt een exacte correspondentie tussen de expressiviteit van recurrente grafische neurale netwerken en die van recurrente rekenkringen over de reële getallen, waarbij beide modellen elkaars berekeningen kunnen simuleren.

Timon Barlag, Vivian Holzapfel, Laura Strieker + 2 more2026-03-06🤖 cs.AI

Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers

Dit paper biedt een theoretisch en empirisch inzicht in hoe transformers analogisch redeneren door entiteiten met vergelijkbare eigenschappen in gelijke representaties te coderen, waarbij een specifiek curriculum voor het leren van gelijkenissen cruciaal is voor het succes van eigenschapsoverdracht.

Ruichen Xu, Wenjing Yan, Ying-Jun Angela Zhang2026-03-06🤖 cs.LG

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Dit paper introduceert fedCI en fedCI-IOD, privacybehoudende federatieve methoden die causale ontdekking mogelijk maken over heterogene, gedistribueerde datasets met latente confounding door middel van geavanceerde conditionele onafhankelijkheidstests.

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

The Impact of Preprocessing Methods on Racial Encoding and Model Robustness in CXR Diagnosis

Dit onderzoek toont aan dat eenvoudige long-cropping een effectieve strategie is om raciale bias in deep learning-modellen voor borstfoto's te verminderen zonder de diagnostische nauwkeurigheid te verliezen.

Dishantkumar Sutariya, Eike Petersen2026-03-06🤖 cs.LG

Balancing Privacy-Quality-Efficiency in Federated Learning through Round-Based Interleaving of Protection Techniques

Dit paper introduceert Alt-FL, een privacybehoudend framework voor Federated Learning dat via een ronde-gebaseerde strategie Differential Privacy, Homomorf Versleuteling en synthetische data combineert om een flexibel evenwicht te vinden tussen privacy, leerkwaliteit en efficiëntie.

Yenan Wang, Carla Fabiana Chiasserini, Elad Michael Schiller2026-03-06🤖 cs.LG

A Geometry-Adaptive Deep Variational Framework for Phase Discovery in the Landau-Brazovskii Model

Dit artikel introduceert GeoDVF, een geometrie-adaptief diep variatiekader dat door het gezamenlijk optimaliseren van de ordeparameter en de domeingrootte kunstmatige spanningen elimineert en zo robuust stabiele en metastabiele fasen in het Landau-Brazovskii-model kan ontdekken zonder voorafgaande kennis.

Yuchen Xie, Jianyuan Yin, Lei Zhang2026-03-06🔬 cond-mat.mtrl-sci

Trainable Bitwise Soft Quantization for Input Feature Compression

Deze paper introduceert een trainbare bit-wise zachte quantisatielaag die invoerfeatures van neurale netwerken comprimeert om de data-overdracht van edge-apparaten naar servers te minimaliseren, waarbij hoge compressiefactoren worden bereikt zonder significante nauwkeurigheidsverlies.

Karsten Schrödter, Jan Stenkamp, Nina Herrmann + 1 more2026-03-06🤖 cs.LG

Incentive Aware AI Regulations: A Credal Characterisation

Dit paper introduceert een mechanismeontwerpframework voor AI-regulatie dat, gebaseerd op een dualiteit met credale verzamelingen, strategische aanbieders ertoe dwingt te wedden op hun naleving en zo zorgt voor een perfecte marktuitkomst waarbij niet-compliance zich zelf uitsluit.

Anurag Singh, Julian Rodemann, Rajeev Verma + 2 more2026-03-06🤖 cs.LG

Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics

Deze paper introduceert STCV, een nieuw algoritme voor de robuuste en schaal-onafhankelijke identificatie van niet-lineaire dynamica dat de vervormende effecten van datanormalisatie op traditionele methoden oplost door in plaats van op grootte te vertrouwen op een dimensieloze statistische metric voor termselectie.

Jay Raut, Daniel N. Wilke, Stephan Schmidt2026-03-06🤖 cs.LG

Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation

Dit paper introduceert Stable-LoRA, een methode die de stabiliteit van feature learning bij Low-Rank Adaptation (LoRA) verbetert door een dynamische gewichtsverkleiningstrategie te gebruiken die instabiliteit elimineert zonder extra geheugenvereisten of merkbare rekentijd.

Yize Wu, Ke Gao, Ling Li + 1 more2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Dit paper introduceert een vocabulaire-trimmingtechniek voor speculatieve decoding die het compromis tussen dekking en latentie oplost door een geoptimaliseerde, domeinspecifieke woordenschat te selecteren, wat leidt tot aanzienlijke snelheidswinsten bij het genereren van tekst met grote taalmodellen.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning

Dit artikel introduceert IAENet, een Transformer-gebaseerd multi-label leerframework dat, ondersteund door een nieuw dataset (MuAE) en een geavanceerde loss-functie, de voorspelling van intraoperatieve adverse events aanzienlijk verbetert door complexe tijdsafhankelijkheden en onbalans in medische data effectief aan te pakken.

Xueyao Wang, Xiuding Cai, Honglin Shang + 2 more2026-03-06🤖 cs.AI

KARL: Knowledge Agents via Reinforcement Learning

Deze paper introduceert KARL, een systeem dat via multi-task versterkt leren en synthetische trainingsdata state-of-the-art prestaties bereikt op diverse complexe zoektaken binnen ondernemingen, waarbij het zelfs gesloten modellen zoals Claude 4.6 en GPT 5.2 overtreft op kosten-kwaliteit en latentie-kwaliteit afwegingen.

Jonathan D. Chang, Andrew Drozdov, Shubham Toshniwal + 23 more2026-03-06🤖 cs.AI

Learning Optimal Individualized Decision Rules with Conditional Demographic Parity

Deze paper introduceert een nieuw kader voor het afleiden van optimale individuele beslissingsregels dat demografische pariteit en conditionele demografische pariteit waarborgt door perturbaties toe te passen op de onbeperkt optimale regels, wat leidt tot een computationeel efficiënte oplossing met bewezen convergentie.

Wenhai Cui, Wen Su, Donglin Zeng + 1 more2026-03-06🤖 cs.LG

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Dit artikel toont aan dat het elimineren van specifieke architecturale vrijheidsgraden, zoals onbegrensde representatiemagnitude en data-afhankelijke attentierouting, de grokking-fase in Transformers voor modulaire optelling volledig kan doorbreken door de architectuur af te stemmen op de intrinsieke symmetrieën van de taak.

Alper Yıldırım2026-03-06🤖 cs.AI

Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards

Dit artikel introduceert ASR-TRA, een nieuw testtijd-aanpassingskader dat gebruikmaakt van versterkingslering met audio-taal semantische beloningen om de robuustheid van spraakherkenningssystemen te verbeteren in uitdagende real-world omstandigheden zonder grondwahrheidlabels.

Linghan Fang, Tianxin Xie, Li Liu2026-03-06🤖 cs.AI

SlideSparse: Fast and Flexible (2N-2):2N Structured Sparsity

SlideSparse is het eerste systeem dat op commodity GPU's de NVIDIA Sparse Tensor Cores activeert voor de accurate $(2N-2):2N$ -structuur door middel van een Sliding Window Decomposition en Activation Lifting, waardoor LLM's zoals Qwen2.5-7B een tot 1,33x snelheidswinst behalen zonder nauwkeurigheidsverlies.

Hanyong Shao, Yingbo Hao, Ting Song + 10 more2026-03-06🤖 cs.LG

Recursive Inference Machines for Neural Reasoning

Deze paper introduceert Recursive Inference Machines (RIMs), een neuraal redeneerkader dat klassieke inferentiemechanismen integreert om bestaande modellen zoals TRMs te verbeteren en prestaties op complexe taken zoals ARC-AGI en Sudoku te verhogen.

Mieszko Komisarczyk, Saurabh Mathur, Maurice Kraus + 2 more2026-03-06🤖 cs.AI

A Behaviour-Aware Federated Forecasting Framework for Distributed Stand-Alone Wind Turbines

Deze paper introduceert een privacyvriendelijk, federatief leerframework dat windturbines op basis van hun gedragsstatistieken clusteren en vervolgens groepspecifieke LSTM-modellen trainen om nauwkeurige kortetermijnvoorspellingen te genereren zonder dat gegevens centraal hoeven te worden samengevoegd.

Bowen Li, Xiufeng Liu, Maria Sinziiana Astefanoaei2026-03-06🤖 cs.LG

Beyond Word Error Rate: Auditing the Diversity Tax in Speech Recognition through Dataset Cartography

Dit artikel introduceert een nieuw auditkader voor spraakherkenning dat, door het gebruik van semantische metrieken en de Sample Difficulty Index (SDI) in plaats van alleen woordfoutpercentages, de systematische 'diversiteitsbelasting' voor gemarginaliseerde sprekers blootlegt en helpt bij het mitigeren van deze ongelijkheid.

Ting-Hui Cheng, Line H. Clemmensen, Sneha Das2026-03-06🤖 cs.LG

← Vorige Volgende →