cs.LG papers | Gist.Science

AMiD: Knowledge Distillation for LLMs with $α$ -mixture Assistant Distribution

Dit artikel introduceert AMiD, een unificerend kader voor kennisdistillatie van grote taalmodellen dat gebruikmaakt van een nieuwe $\alpha$ -gemengde assistentverdeling om trainingsstabiliteit en prestaties te verbeteren door de beperkingen van eerdere methoden te overwinnen.

Donghyeok Shin, Yeongmin Kim, Suhyeon Jo + 2 more2026-03-05🤖 cs.AI

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Dit artikel introduceert MAYA, een op multi-armed bandits gebaseerd sequentieel imitatieleermodel dat de beslissingen van bijen tijdens het foerageren nabootst en voorspelt door rekening te houden met hun beperkte geheugen, en dat hiermee uitblinkt in prestaties en interpretatie ten opzichte van bestaande methoden.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Self-Attention Transformers

Dit artikel toont theoretisch en empirisch aan dat de Query-weights in self-attention transformers overbodig zijn en kunnen worden vervangen door een eenheidsmatrix, wat leidt tot een 25% reductie in parameters en een stabielere training zonder prestatieverlies.

Marko Karbevski, Antonij Mijoski2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Dit artikel toont aan dat de impliciete bias van per-stap Adam op lineair scheidbare data kan afwijken van de volledige-batch-regime en zelfs convergeren naar een $\ell_2$ -max-margin classifier, terwijl de bias van Signum onafhankelijk blijft van de batchgrootte.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum

Dit artikel introduceert CNFP, een nieuw diffusion-model dat Cloud-Native Network Functions effectief plaatst in het cloud-continuüm door het probleem te benaderen als een conditionele graf-naar-toewijzing generatie-taak, wat leidt tot schaalbare, haalbare oplossingen met snellere inferentie dan bestaande methoden.

Álvaro Vázquez Rodríguez, Manuel Fernández-Veiga, Carlos Giraldo-Rodríguez2026-03-05🤖 cs.LG

NeuCLIP: Efficient Large-Scale CLIP Training with Neural Normalizer Optimization

Het paper introduceert NeuCLIP, een innovatief optimalisatiekader dat de contrastieve loss voor CLIP-modellen herschrijft via convex en variatieanalyse om een compact neuraal netwerk te gebruiken voor het nauwkeurig schatten van normalisatie-termen, waardoor de afhankelijkheid van enorme batchgroottes wordt doorbroken en de prestaties op grote datasets significant worden verbeterd.

Xiyuan Wei, Chih-Jen Lin, Tianbao Yang2026-03-05🤖 cs.LG

Implicit Bias of the JKO Scheme

Dit artikel karakteriseert de impliciete bias van het JKO-schema op tweede orde in de stapgrootte door te tonen dat het equivalent is aan een Wasserstein-gradiëntstroom op een gewijzigde energiefunctie die een straffing bevat die afhangt van de metriekkromming van de oorspronkelijke energie.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Dit onderzoek toont aan dat er een sterke positieve correlatie bestaat tussen de prestaties van audio-modellen in downstream-taken en hun mate van overeenkomst met hersenactiviteit, wat suggereert dat hersenachtige representaties een emergent bijproduct zijn van het leren van het reconstrueren van natuurlijke audio-gegevens.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model

EnECG is een efficiënt ensemble-framework dat gespecialiseerde foundation modellen voor elektrocardiogrammen combineert via een Mixture of Experts-mechanisme en Low-Rank Adaptation, waardoor de rekenkosten worden verlaagd terwijl de prestaties voor meerdere diagnostische taken worden geoptimaliseerd.

Yuhao Xu, Xiaoda Wang, Jiaying Lu + 6 more2026-03-05🤖 cs.AI

Soft Quality-Diversity Optimization

Deze paper introduceert 'Soft QD', een nieuwe formulering van kwaliteits-diversiteitsoptimalisatie die discretisatie overbodig maakt en leidt tot het schaalbare, differentieerbare algoritme SQUAD, dat concurrerend is met de state-of-the-art op standaard benchmarks en beter presteert in hoogdimensionale ruimtes.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.LG

Weight Space Representation Learning via Neural Field Adaptation

Deze studie toont aan dat het beperken van de optimalisatie tot een voorgeïmplementeerde basis en LoRA-structuur leidt tot gewichtsruimtes die effectieve, semantisch gestructureerde representaties vormen die superieure generatiekwaliteit bieden in vergelijking met bestaande methoden.

Zhuoqian Yang, Mathieu Salzmann, Sabine Süsstrunk2026-03-05🤖 cs.AI

ceLLMate: Sandboxing Browser AI Agents

Dit paper introduceert ceLLMate, een browser-uitbreiding die browser-gebaseerde AI-agenten beveelt tegen prompt-injectieaanvallen door hun macht te beperken op het HTTP-niveau, waardoor de kwetsbaarheid van laag-niveau UI-acties wordt omzeild met een minimale vertraging.

Luoxi Meng, Henry Feng, Ilia Shumailov + 1 more2026-03-05🤖 cs.LG

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

Dit paper introduceert NRR-Core, een computationeel raamwerk dat ambiguïteit behoudt in plaats van deze voortijdig op te lossen, door principes zoals niet-identiteit en niet-resolutie te implementeren om contextuele identiteit en interpretatieve flexibiliteit te waarborgen.

Kei Saito2026-03-05🤖 cs.AI

Learning under Distributional Drift: Prequential Reproducibility as an Intrinsic Statistical Resource

Dit artikel introduceert een intrinsiek driftbudget $C_T$ , gemeten in Fisher-Rao-afstand, om de prequential reproduceerbaarheid onder distributie-drift te karakteriseren door exogene verandering en feedback-gedreven drift te scheiden, waarbij wordt aangetoond dat de reproduceerbaarheidsfout begrensd wordt door $T^{-1/2} + C_T/T$ .

Sofiya Zaichyk2026-03-05🤖 cs.LG

BumpNet: A Sparse MLP Framework for Learning PDE Solutions

Dit artikel introduceert BumpNet, een efficiënt en nauwkeurig raamwerk voor het oplossen van partiële differentiaalvergelijkingen en operatorleren, dat gebruikmaakt van een schaarse MLP-architectuur met volledig trainbare sigmoid-basisfuncties en universaliteit bewijst voor zowel functies als operatoren.

Shao-Ting Chiu, Ioannis G. Kevrekidis, Ulisses Braga-Neto2026-03-05🤖 cs.LG

Online Robust Reinforcement Learning with General Function Approximation

Dit artikel introduceert een volledig online algoritme voor distributioneel robuust versterkend leren met algemene functiebenadering dat, zonder afhankelijkheid van vooraf verzamelde data, robuuste beleidslijnen leert via interactie en sublineaire regret-garanties biedt op basis van de robuuste Bellman-Eluder-dimensie.

Debamita Ghosh, George K. Atia, Yue Wang2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Dit paper introduceert OASI, een methode voor multi-objectieve Bayesiaanse optimalisatie die surrogate-modellen initialiseert met Pareto-biasseerde oplossingen om memory-feasible keyword-spotting-modellen voor TinyML-apparaten efficiënter te vinden dan bestaande methoden.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Generalization of RLVR Using Causal Reasoning as a Testbed

Dit artikel toont aan dat versterkt leren met verifieerbare beloningen (RLVR) de generalisatie van causale redenering bij grote taalmodellen verbetert ten opzichte van toezichtsfine-tuning, maar dat dit succes afhankelijk is van een voldoende initiële redeneercompetentie van het model.

Brian Lu, Hongyu Zhao, Shuo Sun + 3 more2026-03-05🤖 cs.AI

Deterministic Coreset for Lp Subspace

Dit artikel introduceert het eerste deterministische iteratieve algoritme voor het construeren van een $\varepsilon$ -coreset dat een $\ell_p$ -subruimte-inbedding garandeert voor elke $p \in [1,\infty)$ , waarbij logaritmische factoren in de grootte van de coreset worden verwijderd om een optimale en deterministische oplossing te bieden voor $\ell_p$ -regressieproblemen.

Rachit Chhaya, Anirban Dasgupta, Dan Feldman + 1 more2026-03-05🤖 cs.LG

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

Dit paper introduceert DevRev-Search, een benchmark en een schaalbaar framework voor multi-tenant zoeksystemen dat gebruikmaakt van een volledig geautomatiseerd datasetbouwpipeline en een indexbehoudende aanpassingsstrategie om alleen de query-encoder te finetunen, waardoor effectieve domeinadaptatie mogelijk wordt zonder kostbare herschrijving van documentindices.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI

← Vorige Volgende →

cs.LG

AMiD: Knowledge Distillation for LLMs with ααα-mixture Assistant Distribution