cs.LG papers | Gist.Science

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

In dit artikel wordt een nieuw trust-region interior-point stochastisch sequentieel kwadratisch programmeringsalgoritme (TR-IP-SSQP) voorgesteld voor het oplossen van optimalisatieproblemen met een stochastische doelfunctie en deterministische niet-lineaire constraints, waarvan de globale convergentie naar stationaire punten wordt bewezen en de praktische prestaties worden getest op CUTEst-problemen en logistische regressie.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

Het paper introduceert I2X, een raamwerk dat ongestructureerde interpretatie omzet in gestructureerde, prototype-gebaseerde verklaringen voor beeldclassificatiemodellen, waardoor niet alleen het besluitvormingsproces transparant wordt maar ook de voorspellingsnauwkeurigheid kan worden verbeterd door gerichte fine-tuning.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

Het artikel introduceert One-A, een unificerend raamwerk voor stap-ongeweven klassen-incrementeel leren dat door asymmetrische subspace-alignatie en gerichte gating een enkele adapter gebruikt om stabiel en efficiënt te leren van taken met sterk variërende grootte.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Dit onderzoek toont aan dat een neuromorfe algoritme voor het oplossen van partiële differentiaalvergelijkingen intrinsiek zeer robuust is tegen structurele storingen, waarbij tot 32% van de neuronen en 90% van de spikes verloren kunnen gaan zonder significante nauwkeurigheidsverlies.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

Dit paper introduceert SiMPO, een unificerend raamwerk voor online diffusiële versterkende leer dat het gebruik van negatieve steekproeven mogelijk maakt door een virtueel doelbeleid te construeren via een getekend maatstelsel, waardoor suboptimale acties effectief worden afgestoten en de prestaties worden verbeterd.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

Dit artikel toont aan dat wanneer de prior in een Bayesiaans hiërarchisch model een canonieke verdeling is, de resulterende afhankelijke marginale prior ook een maximum-entropie-eigenschap bezit, maar dan met een andere constraint op de marginale verdeling van een functie van de onbekende grootheden.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

Dit paper verbetert de kwaliteit en causaliteit van synthetische tabulaire data gegenereerd door TabPFN door de autoregressieve generatie te integreren met causale structuren via DAG-gerichte conditionering en CPDAG-strategieën.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Deze studie presenteert een doorbraak waarbij een compact en performant hematopoëtisch algoritme wordt geëxtraheerd uit de interne mechanica van het foundation-model scGPT, wat resulteert in een standalone methode die zonder hertraining superieure prestaties levert ten opzichte van bestaande tools en de interpretatie van biologische foundation-modellen mogelijk maakt.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

Dit paper introduceert DICE-RL, een efficiënt finetuningframework dat vooraf getrainde generatieve robotpolicies omzet in hoogpresterende experts door online feedback te gebruiken voor selectieve gedragsregularisatie en waardegeleide actiekeuze.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

Dit artikel presenteert een snelle methode voor het schatten van de conditienummer van schaarse matrices met behulp van graph neural networks, die aanzienlijke snelheidswinst biedt ten opzichte van traditionele methoden zoals Hager-Higham en Lanczos.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Deze paper introduceert en bewijst dat exponentiële reward-gewogen SFT een robuustere en schaalbaarder post-training methode is voor generatieve aanbevelingssystemen dan RLHF, omdat deze direct op waargenomen beloningen werkt zonder reward-modellen of propensity scores, terwijl de temperatuurparameter de afweging tussen robuustheid en verbetering theoretisch en empirisch regelt.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Deze paper introduceert ADMM-PnP met een AC-DC-ontruisingsmechanisme om de convergentie en prestaties van score-gebaseerde generatieve modellen in ADMM voor inverse problemen te verbeteren door een driestapsaanpak die de mismatch tussen trainingsmanifolden en iteraties oplost.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Dit paper introduceert een interpreteerbare 'hoekscore' gebaseerd op de gegeneraliseerde singuliere waardenontbinding (GSVD) om individuele steekproeven te diagnosticeren en te bepalen of ze beter worden verklaard door het ene of het andere dataset-geometrische model.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

Het artikel introduceert Copula-ResLogit, een nieuw interpreteerbaar kader dat ResNet-architecturen en copula-modellen combineert om ongemeten verstorende factoren in reisvraaganalyses te detecteren en te corrigeren.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Dit artikel introduceert MultiwayPAM, een nieuwe tensor-clusteringmethode die de rekentijd en inherent bias van LLM-as-a-Judge-evaluaties vermindert door gelijktijdig clusterleden en medoïden te schatten voor vragen, antwoordgevers en beoordelaars.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Dit onderzoek toont aan dat kwantumverstrengeling in een hybride agent voor het spel Pong leidt tot superieure prestaties in competitieve versterkende leeromgevingen door het leren van structureel verschillende en effectievere representaties van interacterende staten.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Dit artikel introduceert HyMEM, een hybride, zelfevoluerende gestructureerde grafgeheugenarchitectuur die open-source GUI-agents aanzienlijk verbetert door multi-hop-retrieval en dynamische updates mogelijk te maken, waardoor zelfs kleinere modellen presteren die concurreren met of superieur zijn aan geavanceerde gesloten modellen.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

Het artikel introduceert GaLoRA, een parameter-efficiënt framework dat structurele informatie integreert in grote taalmodellen om de prestaties van knoopclassificatie op tekst-geattribueerde grafen te verbeteren met slechts 0,24% van de parameters die nodig zijn voor volledige fine-tuning.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Dit paper introduceert een regimewaakzaam in-context leerframework dat voorgeprogrammeerde grote taalmodellen gebruikt om financiële volatiliteit te voorspellen door historische patronen te redeneren en voorspellingen dynamisch aan te passen aan veranderende marktomstandigheden zonder parameterfine-tuning.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Dit onderzoek introduceert een zoekprocedure om bijna-optimale leerplansvormen te vinden en toont aan dat hoewel warmup en decay robuuste kenmerken zijn, veelgebruikte schema's niet optimaal zijn en dat gewichtsdecay een sterke invloed heeft op de ideale vorm.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

← Vorige Volgende →