cs.LG papers | Gist.Science

Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Deze paper introduceert Whisperer, een visueel prompting-framework dat via een vierstaps curriculum van gedragsklooning stochastisch ontdekte pixelruimteverbeteringen leert te repliceren om ingevroren OCR-modellen zoals EasyOCR aanzienlijk te verbeteren zonder hun gewichten aan te passen.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Deze studie toont aan dat voor de optimale out-of-distribution-probing van Vision Transformers de beste prestaties worden behaald door zowel de juiste modellaag als het specifieke moduletype (feedforward-netwerk bij sterke distributieveranderingen versus genormaliseerde self-attention bij zwakke veranderingen) te selecteren.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

Dit artikel introduceert Bayesian Supervised Causal Clustering (BSCC), een Bayesiaanse methode die patiëntsubgroepen identificeert op basis van zowel covariaten als behandelingseffecten om de persoonlijke besluitvorming in de gezondheidszorg te verbeteren.

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

Knowledge Divergence and the Value of Debate for Scalable Oversight

Dit artikel biedt een formeel raamwerk dat de waarde van AI-debat voor schaalbaar toezicht relateert aan de geometrische kennisdivergentie tussen modellen, waarbij wordt aangetoond dat debat alleen een significant voordeel biedt wanneer de kennis van de deelnemers divergeert in een specifiek lineair regime.

Robin Young2026-03-06🤖 cs.LG

Latent Policy Steering through One-Step Flow Policies

Dit paper introduceert Latent Policy Steering (LPS), een robuuste methode voor offline versterkend leren die door middel van een differentieerbare één-stap MeanFlow-beleid de originele actieruimte-kritiek direct doorgeeft naar de latente ruimte, waardoor de afhankelijkheid van kwetsbare proxy-kritieken wordt geëlimineerd en state-of-the-art prestaties worden behaald met minimale tuning.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

In dit artikel wordt WavSLM voorgesteld, een spraaktaalmodel dat via distillatie van WavLM-representaties in een enkele codebook wordt getraind om semantische en akoestische informatie zonder tekstsupervisie in één tokenstroom te modelleren, waardoor het een schaalbaar en coherent generatief paradigma voor spraak mogelijk maakt.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Dit paper introduceert asymmetrische Shapley-waarden als een eerlijker maatstaf voor het bepalen van de belang van genen in klinische voorspellingsmodellen, waarbij rekening wordt gehouden met collineariteit en de richting van afhankelijkheden, en presenteert efficiënte algoritmen voor lokale en globale interpretatie die worden geïllustreerd aan de hand van colorectale kanker.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

Dit paper introduceert GALACTIC, het eerste geünificeerde framework dat lokale en globale contrafactuele verklaringen biedt voor onbewaakte tijdreeksclustering door middel van een clusterbewuste optimalisatie en een submodulaire MDL-objective voor het selecteren van niet-redundante samenvattingen.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI

FairFinGAN: Fairness-aware Synthetic Financial Data Generation

Dit artikel introduceert FairFinGAN, een op WGAN gebaseerd framework dat synthetische financiële data genereert met geïntegreerde eerlijkheidsbeperkingen om bias te verminderen zonder de bruikbaarheid voor voorspellende taken significant te verlagen.

Tai Le Quy, Dung Nguyen Tuan, Trung Nguyen Thanh + 3 more2026-03-06🤖 cs.LG

Bayes with No Shame: Admissibility Geometries of Predictive Inference

Dit artikel toont aan dat voorspellende inferentie wordt geregeerd door vier onderling niet-nestede admissibiliteitsgeometrieën met elk hun eigen optimaliteitscertificaat, waardoor admissibiliteit onherroepelijk afhankelijk is van het gekozen criterium.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

On the Statistical Optimality of Optimal Decision Trees

Deze paper ontwikkelt een uitgebreide statistische theorie die de optimaliteit van empirisch risicominimaliserende beslissingsbomen bewijst door scherpe orakelongelijkheden af te leiden en minimax-optimale rates te vaststellen voor een nieuw functioneel klasse dat sparsiteit, anisotrope gladheid en ruimtelijke heterogeniteit omvat.

Zineng Xu, Subhroshekhar Ghosh, Yan Shuo Tan2026-03-06🔢 math

Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs

Deze paper introduceert Geometric-Aware Quantization (GAQ), een framework dat de SO(3)-equivariantie van moleculaire simulaties behoudt tijdens compressie, waardoor op consumerhardware snellere en energiezuinigere simulaties mogelijk worden zonder nauwkeurigheidsverlies.

Haoyu Zhou, Ping Xue, Hao Zhang + 1 more2026-03-06🤖 cs.LG

InfoFlow KV: Information-Flow-Aware KV Recomputation for Long Context

Dit paper introduceert InfoFlow KV, een methode die selectieve KV-cache-herberekening voor lange contexten optimaliseert door tokens te identificeren op basis van informatieflow en globale posities te reconstrueren, wat leidt tot consistente prestatieverbeteringen in RAG-systemen.

Xin Teng, Canyu Zhang, Shaoyi Zheng + 3 more2026-03-06🤖 cs.LG

Learning Causal Structure of Time Series using Best Order Score Search

Dit paper introduceert TS-BOSS, een schaalbaar en theoretisch onderbouwd algoritme voor het leren van causale structuren in multivariate tijdreeksen dat, door een permutatiegebaseerde zoektocht te combineren met grow-shrink trees, superieure prestaties boekt in regimes met hoge auto-correlatie vergeleken met bestaande methoden.

Irene Gema Castillo Mansilla, Urmi Ninad2026-03-06🤖 cs.AI

Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition

Deze paper introduceert een nieuw diep adversariaal raamwerk dat inter-subject variabiliteit expliciet integreert om subjectonafhankelijke kenmerkrepresentaties te leren, wat leidt tot verbeterde generalisatie en prestaties in menselijke activiteitsherkenning op basis van draagbare inertieel sensoren.

Francisco M. Calatrava-Nicolás, Shoko Miyauchi, Vitor Fortes Rey + 3 more2026-03-06🤖 cs.LG

Robust Node Affinities via Jaccard-Biased Random Walks and Rank Aggregation

Dit artikel introduceert TopKGraphs, een interpreteerbare en niet-parametrische methode die Jaccard-gebiaseerde random walks en rangschikkingsaggregatie combineert om robuuste knoopaffiniteiten te schatten, wat leidt tot superieure prestaties in diverse netwerkanalyse- en machinaal-leertaken vergeleken met bestaande methoden.

Bastian Pfeifer, Michael G. Schimek2026-03-06🤖 cs.LG

On the Necessity of Learnable Sheaf Laplacians

Deze paper betoogt dat het leren van restrictiekaarten in Sheaf Neural Networks niet noodzakelijk is voor het verminderen van oversmoothing op heterofiele grafen, aangezien een basismodel met vaste identiteitsrestricties vergelijkbare prestaties levert.

Ferran Hernandez Caralt, Mar GonzÃ lez i CatalÃ, Adrián Bazaga + 1 more2026-03-06🤖 cs.LG

Harnessing Synthetic Data from Generative AI for Statistical Inference

Dit artikel biedt een statistische review van het gebruik van synthetische data gegenereerd door generatieve AI, waarbij het de aannames, beperkingen en valkuilen belicht om een gefundeerd kader te bieden voor betrouwbare inferentie en praktische richtlijnen te ontwikkelen.

Ahmad Abdel-Azim, Ruoyu Wang, Xihong Lin2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Het artikel introduceert MobileFetalCLIP, een methode voor selectieve repulsieve kennisdistillatie die een compact model van 11,4 miljoen parameters ontwikkelt dat de prestaties van een groot 304M-parameter leraarmodel op het gebied van foetale echografieanalyse overtreft en real-time implementatie op mobiele apparaten mogelijk maakt.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

An interpretable prototype parts-based neural network for medical tabular data

Deze paper introduceert een inherent interpreteerbaar, prototype-gebaseerd neuronaal netwerk voor medische tabulaire data dat door het leren van menselijk leesbare, gediscretiseerde kenmerken transparante voorspellingen mogelijk maakt zonder in te leveren op prestaties.

Jacek Karolczak, Jerzy Stefanowski2026-03-06🤖 cs.LG

← Vorige Volgende →