cs.LG papers | Gist.Science

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

Dit paper introduceert EgoDex, het grootste en meest diverse dataset tot nu toe van dexterous manipulatie met 829 uur egocentrisch video en gepaarde 3D-handtracking, verzameld met Apple Vision Pro om imitatieleer voor robotica en computerzicht te bevorderen.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

FreeKV is een trainingsvrije, co-geoptimaliseerde framework dat de efficiëntie van KV-cache-retrieval voor grote taalmodellen aanzienlijk verbetert door speculatieve retrieval en hybride geheugenlayouts te combineren, waardoor een snelheidswinst tot 13x wordt bereikt met minimale nauwkeurigheidsverlies.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

Online Decision-Focused Learning

Deze paper introduceert twee nieuwe online algoritmen voor decision-focused learning in dynamische omgevingen, die door middel van regularisatie en perturbatietechnieken de uitdagingen van niet-convexe en niet-differentieerbare doelfuncties overwinnen en voor het eerst wiskundige prestatiegaranties bieden.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain Durmus2026-03-10🤖 cs.LG

Vid2World: Crafting Video Diffusion Models to Interactive World Models

Dit paper introduceert Vid2World, een methode die voorgeöefende videodiffusiemodellen omvormt tot interactieve wereldmodellen door causaliteit en causale actiesturing te integreren, waardoor deze modellen schaalbaar en effectief kunnen worden ingezet voor complexe besluitvormingstaken zoals robotbesturing en navigatie.

Siqiao Huang, Jialong Wu, Qixing Zhou, Shangchen Miao, Mingsheng Long2026-03-10🤖 cs.LG

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

Het paper introduceert MAS-ZERO, het eerste zelfevoluerende raamwerk voor het ontwerpen van multi-agent systemen zonder toezicht dat tijdens de inferentie dynamisch agentconfiguraties aanpast en verfijnt op basis van meta-feedback, waardoor het aanzienlijk beter presteert dan bestaande handmatige en automatische methoden op diverse complexe taken.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

Dit paper introduceert HDLxGraph, een nieuw framework dat Large Language Models koppelt aan HDL-repositories via grafische databases en Abstract Syntax Trees om de beperkingen van traditionele RAG-systemen bij complexe hardware-beschrijvingsopdrachten te overwinnen, ondersteund door een nieuw benchmark-dataset genaamd HDLSearch.

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

Dit paper introduceert WikiDBGraph, een uitgebreide benchmarksuite gebaseerd op 100.000 real-world databases, om de kloof tussen bestaande methoden voor collaboratief leren en de complexe realiteit van gefragmenteerde en niet-uitgelijnde databasesiloes te dichten.

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Deze paper introduceert AgarCL, een nieuw onderzoeksplatform voor continu versterkingsleren gebaseerd op het spel Agar.io, dat complexe, niet-episodische dynamiek biedt en aantoont dat bestaande methoden voor continu leren weinig verbetering bieden ten opzichte van standaard algoritmen.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Dit paper introduceert X-MethaneWet, het eerste cross-schaal wereldwijde benchmarkdataset voor methaanemissies uit wetlands dat fysiek gebaseerde simulaties en waarnemingen combineert om AI-modellen te trainen en transfer learning-technieken te evalueren voor verbeterde klimaatmodellering.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Deze paper introduceert een algemeen theoretisch raamwerk voor optimale controle van waarschijnlijkheidsdichtheden, inclusief een maximumprincipe en de Hamilton-Jacobi-Bellman-vergelijking, en koppelt dit aan een schaalbaar numeriek algoritme op basis van diepe neurale netwerken voor de oplossing van complexe meeragentenproblemen.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

Dit paper introduceert VISTA, een trainingsvrij raamwerk dat Vision-Language Models gebruikt om historische aandelenkoersen zowel tekstueel als visueel te analyseren en zo de prestaties van traditionele modellen en tekst-only LLM's aanzienlijk verbetert.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Dit artikel introduceert een nieuwe methode die prompt-injectie-aanvallen op grote taalmodellen effectiever bestrijdt door het bevoorrechte instructieniveau niet alleen aan de invoer, maar ook in de tussenliggende neurale representaties te coderen, wat leidt tot een aanzienlijke vermindering van de aanvalssuccesratio's zonder de nuttigheid van het model te schaden.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Dit artikel introduceert OCN, een nieuwe methode voor linkpredictie die redundantie en over-verzachting in hogere-orde gemeenschappelijke buren aanpakt via orthogonalisatie en normalisatie, waardoor het aanzienlijk beter presteert dan bestaande methoden.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Dit paper introduceert ViTaPEs, een transformer-architectuur die door middel van een innovatieve twee-staps positie-injectie visuele en tactiele data effectief combineert voor taak-agnostische representaties, wat leidt tot state-of-the-art prestaties in herkenning, zero-shot generalisatie en robotische grijpvoorspelling.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

Dit paper introduceert LoFT, een nieuwe parameter-efficiënte fine-tuning-methode die de optimizer-dynamiek van volledige fine-tuning nabootst door de momentum- en variantie-momenten van Adam in een laag-rank deelruimte te projecteren, waardoor de prestaties aanzienlijk worden verbeterd zonder extra inferentiekosten.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Dit paper introduceert ProNC, een nieuw continu leerframework dat de beperkingen van een vaste globale ETF overwint door deze progressief uit te breiden met nieuwe klasprototypen, waardoor catastrofale vergetelheid effectief wordt tegengegaan en de prestaties aanzienlijk worden verbeterd.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Dit paper introduceert een nieuwe, plug-and-play adaptieve correctiemethode die de uitkomsten van neurale operatoren garandeert dat ze fundamentele behoudswetten naleven, waardoor zowel de nauwkeurigheid als de stabiliteit van de oplossingen voor partiële differentiaalvergelijkingen aanzienlijk worden verbeterd ten opzichte van bestaande technieken.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

Dit paper introduceert ActivePusher, een nieuw raamwerk dat residu-fysica en actieve learning combineert om de data-efficiëntie en het succes van lang-horizon planning voor niet-greep manipulatie in zowel simulatie als de echte wereld te verbeteren.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

Leveraging chaotic transients in the training of artificial neural networks

Dit artikel toont aan dat het trainen van kunstmatige neurale netwerken met ongebruikelijk grote leersnelheden, waardoor ze zich in een overgangsregime van chaotische dynamica bevinden, de balans tussen exploratie en exploitatie verbetert en zo de trainingsduur aanzienlijk verkort.

Pedro Jiménez-González, Miguel C. Soriano, Lucas Lacasa2026-03-10🤖 cs.LG

← Vorige Volgende →