cs.LG papers | Gist.Science

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Dit artikel introduceert de Decoupled Expected Quadratic Loss (DEQL) om het EDLAE-model voor aanbevelingssystemen te generaliseren, waardoor efficiënte oplossingen voor de hyperparameter $b > 0$ mogelijk worden die betere prestaties leveren dan de oorspronkelijke $b = 0$ -benadering.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Deze paper introduceert het concept van 'Context Channel Capacity' als een informatie-theoretisch raamwerk dat aantoont dat architecturale aanpassingen, in plaats van algoritmische optimalisaties, essentieel zijn om catastrofaal vergeten in continu leren te voorkomen door de contextpaden structureel onmisbaar te maken.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

Het artikel introduceert DualSpec, een heterogeen speculatiekader voor diepe onderzoeksagenten dat de eind-tot-eind latentie aanzienlijk verlaagt door het onderscheid tussen 'Search'- en 'Visit'-acties te benutten en zo tot 3,28x versnelling te bereiken zonder nauwkeurigheidsverlies.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

Dit paper introduceert OrthoFormer, een transformer-architectuur die instrumentele variabele schatting via neurale controlefuncties integreert om correlatief leren te overwinnen en causale mechanismen te modelleren voor robuustheid bij distributieveranderingen.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

Dit paper introduceert AndroidWorld-Generalization, een benchmark en een schaalbaar RL-trainingsysteem dat Group Relative Policy Optimization (GRPO) combineert om de generalisatie van vision-language-model agents voor mobiele apparaten te evalueren en te verbeteren, waarbij wordt aangetoond dat versterkte leerprestaties significant zijn voor onbekende taakinstanties maar nog beperkt blijven voor onbekende sjablonen en applicaties.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

Dit paper introduceert Data Agent, een end-to-end dynamisch framework dat dataselectie formuleert als een sequentieel beslissingsprobleem om training te versnellen en kosten te verlagen zonder prestatieverlies, door een adaptieve selectiebeleid te leren dat samen met de modeloptimalisatie evolueert.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Dit artikel presenteert kosten-gedreven representatieleren voor Lineair Kwantitatief Gaussische (LQG) controle met onvolledige observaties, waarbij twee methoden worden onderzocht voor het leren van een latente dynamische model en wiskundige garanties worden geboden voor de optimaliteit van de gevonden controller.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

Dit paper introduceert PACT, een fijnafstappingsframework dat veiligheidsdrift voorkomt door de betrouwbaarheid van het model op specifieke veiligheidstokens te regulariseren tijdens het trainen op onschadelijke data, waardoor de veiligheid behouden blijft zonder de prestaties op downstream-taken te schaden.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

Dit paper toont aan dat discrete tokenisatie, gecombineerd met adaptieve Gaussische smoothing, Transformers superieur maakt aan getuned XGBoost voor gekalibreerde tabulaire voorspellingen door zowel prestaties als snelheid te verbeteren.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

Dit paper introduceert Dial, een kennisgebaseerd framework dat de vertaling van natuurlijke taal naar SQL voor verschillende database-systemen verbetert door dialectbewuste logica, een hiërarchische kennisbank en een uitvoeringsgedreven debugcyclus te combineren, wat resulteert in een aanzienlijke stijging van vertaalnauwkeurigheid en dialectondersteuning.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

Dit paper introduceert SLNet, een extreem lichtgewicht architectuur voor 3D-puntenwolkherkenning die via NAPE en GMU een hoge nauwkeurigheid bereikt met aanzienlijk minder parameters en rekencost dan bestaande modellen, terwijl het tegelijkertijd een nieuwe NetScore+-metriek voor efficiëntie presenteert.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Dit paper introduceert de Dual-Stream Transformer, een nieuwe architectuur die het residu-stroom ontbindt in een token-stroom en een context-stroom om een instelbare afweging tussen interpretatie en prestaties te bieden, waarbij specifieke mengstrategieën slechts een minimale kosten van 2,5% opleveren.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

Dit paper introduceert AFTUNE, een lichtgewicht raamwerk dat de integriteit van fine-tuning en inferentie van grote taalmodellen in de cloud waarborgt door verifieerbare uitvoeringssporen te genereren, waardoor klanten betrouwbare audits kunnen uitvoeren zonder onpraktische rekenkosten.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

Dit monografie biedt een rigoureuze overzicht van de theoretische en methodologische aspecten van probabilistische inferentie en leren met behulp van de methode van Stein, inclusief de constructie van Stein-discrepanties, hun eigenschappen en de verbinding met Stein-variational gradient descent.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Deze paper introduceert een lichtgewicht raamwerk voor de aanpassing van spraakverbeteringsmodellen in realistische omgevingen, dat door middel van zelftoezicht opgeleerde low-rank adapters minder dan 1% van de parameters bijwerkt om met slechts 20 updates een robuustheid en geluidskwaliteit te bereiken die concurreren met geavanceerdere methoden.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Deze studie introduceert een conditioneel diffusion-transformer-framework dat, geleid door Hi-C contactkaarten, een ensemble van diverse driedimensionale 3D-genoomstructuren van *E. coli* genereert in plaats van één deterministische structuur.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

Dit paper introduceert een nieuw transformer-ontwerp met architecturale stroomonafhankelijkheid, genaamd Late Fusion Architecture (LFA), dat interpretatie door ontwerp mogelijk maakt door symbolische en semantische informatie gescheiden te houden totdat de uitvoer, waardoor modellen minder afhankelijk worden van positiële heuristieken en meer van semantisch begrip.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Pushing Bistatic Wireless Sensing toward High Accuracy at the Sub-Wavelength Scale

Deze paper introduceert een robuust framework dat, door gebruik te maken van kanaalrespons-amplitudes, de beperkingen van bestaande bistatische draadloze sensorsystemen oplost en zo sub-golflengte bewegingsdetails met bijna een orde van grootte hogere nauwkeurigheid kan reconstrueren.

Wenwei Li, Jiarun Zhou, Qinxiao Quan, Fusang Zhang, Daqing Zhang2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

Dit paper introduceert een verbeterd Random Subspace Local Projections-framework dat door middel van gewogen aggregatie, adaptieve subspace-grootte en aangepaste bootstrap-inferentie robuuste impulsrespons-schattingen mogelijk maakt in hoogdimensionale tijdreeksen, waardoor overfitting wordt verminderd en de stabiliteit en betrouwbaarheid van de inferentie aanzienlijk worden verbeterd.

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

Dit paper introduceert BoT, het eerste framework dat bidirectionele model-schaalveranderingen (van klein naar groot en vice versa) verenigt door modelgewichten te behandelen als continue signalen en Discrete Wavelet-transformaties te gebruiken voor een parameterloze en rekenkundig efficiënte kennisoverdracht.

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

← Vorige Volgende →