cs.LG papers | Gist.Science

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Dit paper toont aan dat Sharpness-Aware Minimization (SAM) bij diepe lineaire netwerken een dieptegedreven impliciete bias vertoont die fundamenteel verschilt van gradient descent, waarbij $\ell_\infty$ -SAM gevoelig is voor initialisatie en $\ell_2$ -SAM een uniek fenomeen van sequentiële kenversterking vertoont dat de beperkingen van onbeperkte impliciete-biasanalyses blootlegt.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Deze studie introduceert Graph-Instructed Neural Networks (GINNs) als een robuust en schaalbaar alternatief voor klassieke methoden om parametrische partiële differentiaalvergelijkingen met variërende randvoorwaarden efficiënt en nauwkeurig te simuleren.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Deze paper introduceert een concept-gestuurd fijntuning-framework dat Vision Transformers robuuster maakt tegen distributieveranderingen door hun interne relevantiekaarten automatisch uit te lijnen met semantische objectconcepten, afgeleid van een LLM en VLM, in plaats van te vertrouwen op spurious correlaties zoals achtergronden.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Dit artikel introduceert het concept van sign-identificeerbaarheid voor driftcoëfficiënten in stationaire stochastische differentiaalvergelijkingen met een bekende causale structuur maar onbekende diffusiematrix, en levert criteria om te bepalen of de tekens van causale effecten uniek kunnen worden afgeleid uit observationele covariantiematrices.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Dit artikel introduceert een algemeen framework voor het evalueren van de kwaliteit van warmtekaarten in multiple instance learning-modellen voor histopathologie, waarbij wordt aangetoond dat methoden zoals perturbation en LRP betrouwbaardere verklaringen bieden dan traditionele attention-mechanismen, wat leidt tot betere modelvalidatie en biologische inzichten.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Dit onderzoek toont aan dat het combineren van met de Koopman-operator afgeleide kenmerken (via EDMD met een gespecialiseerd RBD-woordenboek) en transformatoren superieure prestaties levert voor meerklassige ECG-classificatie vergeleken met wavelet-kenmerken of een eenvoudige hybride aanpak.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Dit paper introduceert een efficiëntere Transformer-architectuur die de dichte output-projectie in multi-head attention vervangt door een vaste Walsh-Hadamard-transformatie gecombineerd met een lichte affiene herschaling, wat resulteert in een aanzienlijke vermindering van parameters, geheugengebruik en inferentiekosten zonder in te leveren op prestaties.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Deze paper introduceert een nieuwe methode voor het genereren van plausibele tegenfeitelijke verklaringen voor tijdreeksclassificatie door middel van gradiëntgebaseerde optimalisatie en soft-DTW-alignment, wat resulteert in verklaringen die niet alleen geldig zijn maar ook een realistische temporele structuur behouden die beter aansluit bij de doelklasse dan bestaande methoden.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Dit artikel overbrugt de kloof tussen online en off-policy experimenten door wiskundig te bewijzen dat hun veelgebruikte variantiereductiemethoden, zoals Difference-in-Means en regressie-aanpassing, structureel equivalent zijn aan respectievelijk optimale inverse propensity scoring en doubly robust schatting.

Olivier Jeunen2026-03-10🤖 cs.LG

Leaderboard Incentives: Model Rankings under Strategic Post-Training

Dit paper analyseert de incentive-structuur van huidige AI-benchmarks, waaruit blijkt dat deze leiden tot strategisch 'benchmaxxing' zonder evenwicht, en stelt dat het 'tune-before-test'-protocol een oplossing biedt die modellen correct rangschikt op basis van hun onderliggende kwaliteit.

Yatong Chen, Guanhua Zhang, Moritz Hardt2026-03-10🤖 cs.LG

Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data

Deze paper introduceert een nieuwe optimalisatiealgoritme gebaseerd op fractionele Weyl-integrals die het Markov-aanneming doorbreekt door het gebruik van een dynamisch gewogen historische geheugenoperator, wat leidt tot aanzienlijk betere prestaties bij het hanteren van onevenwichtige datasets zoals fraudeopsporing en medische diagnostiek.

Gustavo A. Dorrego2026-03-10🤖 cs.LG

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Deze paper introduceert ToCoRL, een framework dat de inherente gedragsplasticiteit van grote taalmodellen benut door middel van token-voorwaardelijke generatie en versterkingslering, waardoor modellen hun gedrag (zoals het schakelen tussen stap-voor-stap redeneren en direct antwoorden) stabiel kunnen aanpassen zonder hun oorspronkelijke vaardigheden te verliezen.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Dit paper analyseert de oorzaken van instabiliteit in niet-lineaire waarde-decompositie voor offline multi-agent versterkingslering en stelt een praktische recept voor dat scale-invariante waarde-normalisatie (SVN) gebruikt om het actor-critic-leren te stabiliseren en de prestaties te maximaliseren.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Geometrically Constrained Outlier Synthesis

Dit paper introduceert GCOS, een trainingsframework dat virtuele outliers genereert in de verborgen feature-ruimte die de manifoldstructuur van in-distributie-data respecteren, waardoor de robuustheid van deep neural networks voor het detecteren van out-of-distribution samples aanzienlijk wordt verbeterd.

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Meta-RL with Shared Representations Enables Fast Adaptation in Energy Systems

Dit paper introduceert een nieuw Meta-RL-framework met gedeelde representaties en een hybride actor-critic-architectuur dat snelle aanpassing en verbeterde generalisatie mogelijk maakt voor energiebeheersystemen, zoals aangetoond door experimenten op een real-world dataset van bijna tien jaar.

Théo Zangato, Aomar Osmani, Pegah Alizadeh2026-03-10🤖 cs.LG

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

Dit paper introduceert SYNAPSE, een trainingsvrij raamwerk dat de interne robustheid en kwetsbaarheden van Transformer-modellen analyseert door middel van neuron-rangschikking en interventies, waarbij het een consistente, domeinonafhankelijke organisatie van representaties en asymmetrische specialisatiepatronen onthult.

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

Dit artikel introduceert IronEngine, een geavanceerd AI-assistentplatform dat via een geünificeerde orchestratiekern en een drie-fasenpipeline planning en uitvoering scheidt, waardoor het een robuuste basis vormt voor algemene persoonlijke assistenten en automatiseringsframeworks.

Xi Mo2026-03-10🤖 cs.LG

Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning

Dit paper introduceert GRACE, een adaptief raamwerk voor klassen-incrementeel leren dat door middel van een cyclische strategie van uitbreiden, beoordelen en comprimeren een optimale balans bereikt tussen plasticiteit en stabiliteit, waardoor de prestaties worden verbeterd en het geheugengebruik tot 73% wordt gereduceerd.

Adrian Garcia-Castañeda, Jon Irureta, Jon Imaz, Aizea Lojo2026-03-10🤖 cs.LG

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Deze prospectieve haalbaarheidsstudie toont aan dat een conversational AI (AMIE) in een echte huisartsenpraktijk veilig en effectief kan worden ingezet voor het verzamelen van anamnese en het formuleren van differentiaaldiagnoses, waarbij de kwaliteit vergelijkbaar was met die van huisartsen, hoewel de huisartsen nog steeds beter scoorden op praktische uitvoerbaarheid en kosten-effectiviteit.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster is een nieuwe methode die de inferentie van grote taalmodellen bij lange contexten versnelt tot 3,6x door middel van semantisch bewuste chunking en een hiërarchische indexering van de KV-cache, waardoor de zoektijd van lineair naar logaritmisch wordt gereduceerd met minimale kwaliteitsverlies.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

← Vorige Volgende →