cs.LG papers | Gist.Science

Sparsity and Out-of-Distribution Generalization

Dit paper presenteert een principieel kader voor out-of-distribution generalisatie dat stelt dat hypothese die gebaseerd zijn op zo min mogelijk kenmerken (sparsiteit) en die voldoende overlappen met de trainingsverdeling op de relevante kenmerken, succesvol generaliseren naar nieuwe verdelingen, wat wordt onderbouwd door een wiskundig bewijs en een uitbreiding naar subspace juntas.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Dit paper introduceert MARIGOLD, een efficiënt bi-niveau optimalisatiekader dat multi-task learning verbetert door het koppelen van modeltraining en gradiëntbalancering, waardoor de rekentijd van bestaande methoden zoals MGDA aanzienlijk wordt verlaagd zonder toegang tot alle taakgradiënten te vereisen.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

Dit paper introduceert een deterministisch, reproduceerbaar systeem voor juridische triage dat RoBERTa-encoders en transparante fuzzy-bands combineert om grote hoeveelheden contractbewijs te classificeren en te selecteren voor menselijke beoordeling, terwijl het tegelijkertijd strikte foutmarges waarborgt en voldoet aan compliance-eisen zoals HIPAA en NERC-CIP.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Dit artikel introduceert de Decoupled Expected Quadratic Loss (DEQL) om het EDLAE-model voor aanbevelingssystemen te generaliseren, waardoor efficiënte oplossingen voor de hyperparameter $b > 0$ mogelijk worden die betere prestaties leveren dan de oorspronkelijke $b = 0$ -benadering.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Deze paper introduceert het concept van 'Context Channel Capacity' als een informatie-theoretisch raamwerk dat aantoont dat architecturale aanpassingen, in plaats van algoritmische optimalisaties, essentieel zijn om catastrofaal vergeten in continu leren te voorkomen door de contextpaden structureel onmisbaar te maken.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

Het artikel introduceert DualSpec, een heterogeen speculatiekader voor diepe onderzoeksagenten dat de eind-tot-eind latentie aanzienlijk verlaagt door het onderscheid tussen 'Search'- en 'Visit'-acties te benutten en zo tot 3,28x versnelling te bereiken zonder nauwkeurigheidsverlies.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

Dit paper introduceert OrthoFormer, een transformer-architectuur die instrumentele variabele schatting via neurale controlefuncties integreert om correlatief leren te overwinnen en causale mechanismen te modelleren voor robuustheid bij distributieveranderingen.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

Dit paper introduceert AndroidWorld-Generalization, een benchmark en een schaalbaar RL-trainingsysteem dat Group Relative Policy Optimization (GRPO) combineert om de generalisatie van vision-language-model agents voor mobiele apparaten te evalueren en te verbeteren, waarbij wordt aangetoond dat versterkte leerprestaties significant zijn voor onbekende taakinstanties maar nog beperkt blijven voor onbekende sjablonen en applicaties.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

Dit paper introduceert Data Agent, een end-to-end dynamisch framework dat dataselectie formuleert als een sequentieel beslissingsprobleem om training te versnellen en kosten te verlagen zonder prestatieverlies, door een adaptieve selectiebeleid te leren dat samen met de modeloptimalisatie evolueert.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Dit artikel presenteert kosten-gedreven representatieleren voor Lineair Kwantitatief Gaussische (LQG) controle met onvolledige observaties, waarbij twee methoden worden onderzocht voor het leren van een latente dynamische model en wiskundige garanties worden geboden voor de optimaliteit van de gevonden controller.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

Dit paper introduceert PACT, een fijnafstappingsframework dat veiligheidsdrift voorkomt door de betrouwbaarheid van het model op specifieke veiligheidstokens te regulariseren tijdens het trainen op onschadelijke data, waardoor de veiligheid behouden blijft zonder de prestaties op downstream-taken te schaden.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

Dit paper toont aan dat discrete tokenisatie, gecombineerd met adaptieve Gaussische smoothing, Transformers superieur maakt aan getuned XGBoost voor gekalibreerde tabulaire voorspellingen door zowel prestaties als snelheid te verbeteren.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Dit paper introduceert Dial, een kennisgebaseerd framework dat de vertaling van natuurlijke taal naar SQL voor verschillende database-systemen verbetert door dialectbewuste logica, een hiërarchische kennisbank en een uitvoeringsgedreven debugcyclus te combineren, wat resulteert in een aanzienlijke stijging van vertaalnauwkeurigheid en dialectondersteuning.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

Dit paper introduceert SLNet, een extreem lichtgewicht architectuur voor 3D-puntenwolkherkenning die via NAPE en GMU een hoge nauwkeurigheid bereikt met aanzienlijk minder parameters en rekencost dan bestaande modellen, terwijl het tegelijkertijd een nieuwe NetScore+-metriek voor efficiëntie presenteert.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Dit paper introduceert de Dual-Stream Transformer, een nieuwe architectuur die het residu-stroom ontbindt in een token-stroom en een context-stroom om een instelbare afweging tussen interpretatie en prestaties te bieden, waarbij specifieke mengstrategieën slechts een minimale kosten van 2,5% opleveren.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

Dit paper introduceert AFTUNE, een lichtgewicht raamwerk dat de integriteit van fine-tuning en inferentie van grote taalmodellen in de cloud waarborgt door verifieerbare uitvoeringssporen te genereren, waardoor klanten betrouwbare audits kunnen uitvoeren zonder onpraktische rekenkosten.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

Dit monografie biedt een rigoureuze overzicht van de theoretische en methodologische aspecten van probabilistische inferentie en leren met behulp van de methode van Stein, inclusief de constructie van Stein-discrepanties, hun eigenschappen en de verbinding met Stein-variational gradient descent.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Deze paper introduceert een lichtgewicht raamwerk voor de aanpassing van spraakverbeteringsmodellen in realistische omgevingen, dat door middel van zelftoezicht opgeleerde low-rank adapters minder dan 1% van de parameters bijwerkt om met slechts 20 updates een robuustheid en geluidskwaliteit te bereiken die concurreren met geavanceerdere methoden.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Deze studie introduceert een conditioneel diffusion-transformer-framework dat, geleid door Hi-C contactkaarten, een ensemble van diverse driedimensionale 3D-genoomstructuren van *E. coli* genereert in plaats van één deterministische structuur.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

Dit paper introduceert een nieuw transformer-ontwerp met architecturale stroomonafhankelijkheid, genaamd Late Fusion Architecture (LFA), dat interpretatie door ontwerp mogelijk maakt door symbolische en semantische informatie gescheiden te houden totdat de uitvoer, waardoor modellen minder afhankelijk worden van positiële heuristieken en meer van semantisch begrip.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

← Vorige Volgende →