cs.LG papers | Gist.Science

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Deze paper introduceert AgarCL, een nieuw onderzoeksplatform voor continu versterkingsleren gebaseerd op het spel Agar.io, dat complexe, niet-episodische dynamiek biedt en aantoont dat bestaande methoden voor continu leren weinig verbetering bieden ten opzichte van standaard algoritmen.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Dit paper introduceert X-MethaneWet, het eerste cross-schaal wereldwijde benchmarkdataset voor methaanemissies uit wetlands dat fysiek gebaseerde simulaties en waarnemingen combineert om AI-modellen te trainen en transfer learning-technieken te evalueren voor verbeterde klimaatmodellering.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Deze paper introduceert een algemeen theoretisch raamwerk voor optimale controle van waarschijnlijkheidsdichtheden, inclusief een maximumprincipe en de Hamilton-Jacobi-Bellman-vergelijking, en koppelt dit aan een schaalbaar numeriek algoritme op basis van diepe neurale netwerken voor de oplossing van complexe meeragentenproblemen.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

Dit paper introduceert VISTA, een trainingsvrij raamwerk dat Vision-Language Models gebruikt om historische aandelenkoersen zowel tekstueel als visueel te analyseren en zo de prestaties van traditionele modellen en tekst-only LLM's aanzienlijk verbetert.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Dit artikel introduceert een nieuwe methode die prompt-injectie-aanvallen op grote taalmodellen effectiever bestrijdt door het bevoorrechte instructieniveau niet alleen aan de invoer, maar ook in de tussenliggende neurale representaties te coderen, wat leidt tot een aanzienlijke vermindering van de aanvalssuccesratio's zonder de nuttigheid van het model te schaden.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Dit artikel introduceert OCN, een nieuwe methode voor linkpredictie die redundantie en over-verzachting in hogere-orde gemeenschappelijke buren aanpakt via orthogonalisatie en normalisatie, waardoor het aanzienlijk beter presteert dan bestaande methoden.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Dit paper introduceert ViTaPEs, een transformer-architectuur die door middel van een innovatieve twee-staps positie-injectie visuele en tactiele data effectief combineert voor taak-agnostische representaties, wat leidt tot state-of-the-art prestaties in herkenning, zero-shot generalisatie en robotische grijpvoorspelling.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

Dit paper introduceert LoFT, een nieuwe parameter-efficiënte fine-tuning-methode die de optimizer-dynamiek van volledige fine-tuning nabootst door de momentum- en variantie-momenten van Adam in een laag-rank deelruimte te projecteren, waardoor de prestaties aanzienlijk worden verbeterd zonder extra inferentiekosten.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Dit paper introduceert ProNC, een nieuw continu leerframework dat de beperkingen van een vaste globale ETF overwint door deze progressief uit te breiden met nieuwe klasprototypen, waardoor catastrofale vergetelheid effectief wordt tegengegaan en de prestaties aanzienlijk worden verbeterd.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Dit paper introduceert een nieuwe, plug-and-play adaptieve correctiemethode die de uitkomsten van neurale operatoren garandeert dat ze fundamentele behoudswetten naleven, waardoor zowel de nauwkeurigheid als de stabiliteit van de oplossingen voor partiële differentiaalvergelijkingen aanzienlijk worden verbeterd ten opzichte van bestaande technieken.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

Dit paper introduceert ActivePusher, een nieuw raamwerk dat residu-fysica en actieve learning combineert om de data-efficiëntie en het succes van lang-horizon planning voor niet-greep manipulatie in zowel simulatie als de echte wereld te verbeteren.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

Leveraging chaotic transients in the training of artificial neural networks

Dit artikel toont aan dat het trainen van kunstmatige neurale netwerken met ongebruikelijk grote leersnelheden, waardoor ze zich in een overgangsregime van chaotische dynamica bevinden, de balans tussen exploratie en exploitatie verbetert en zo de trainingsduur aanzienlijk verkort.

Pedro Jiménez-González, Miguel C. Soriano, Lucas Lacasa2026-03-10🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

Dit paper introduceert EROICA, het eerste online systeem voor het oplossen van prestatieproblemen bij het trainen van grote modellen op schaal, dat door middel van gedetailleerde profilering en differentiële observabiliteit succesvol hardware- en softwarefouten diagnoseert op productiesystemen met ongeveer 100.000 GPU's.

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan Zhai2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Dit paper introduceert BemaGANv2, een geavanceerde GAN-gebaseerde vocoder voor hoogwaardige en langdurige audio-generatie die gebruikmaakt van innovatieve architecturale wijzigingen en een systematische evaluatie van discriminatorscombinaties om temporale coherentie en harmonische structuur te verbeteren.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Dit paper introduceert Co-LoRA, een methode voor gepersonaliseerd federatief leren die heterogene data en modelarchitecturen overbrugt door middel van een taak-relevantiebewuste aggregatiestrategie en een dimensie-invariante module, wat resulteert in superieure prestaties vergeleken met bestaande methoden.

Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars2026-03-10🤖 cs.LG

Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback

Dit artikel introduceert de efficiënte algoritmen Slate-GLM-OFU en Slate-GLM-TS voor het logistische contextuele slate-bandit-probleem, die door lokale planning en globale learing een lage regret van $\tilde{O}(\sqrt{T})$ bereiken met een lage rekentijd per ronde, wat zowel theoretisch wordt onderbouwd als empirisch wordt geverifieerd in synthetische experimenten en praktische toepassingen voor het selecteren van in-context voorbeelden in taalmodellen.

Tanmay Goyal, Gaurav Sinha2026-03-10🤖 cs.LG

Sharpness-Aware Machine Unlearning

Deze paper introduceert Sharp MinMax, een methode die Sharpness-Aware Minimization (SAM) combineert met scherpe maximalisatie om machine unlearning te verbeteren door het model te splitsen in een deel dat retain-signaals leert en een deel dat forget-signaals verwijdert, wat resulteert in superieure prestaties, verminderde feature-entanglement en sterkere weerstand tegen aanvallen vergeleken met bestaande methoden.

Haoran Tang, Rajiv Khanna2026-03-10🤖 cs.LG

Kolmogorov-Arnold Energy Models: Fast, Interpretable Generative Modeling

Dit paper introduceert het Kolmogorov-Arnold Energy Model (KAEM), een nieuwe generatieve aanpak die de snelheid en interpreteerbaarheid van VAE's combineert met de expressiviteit van Energy-based Models door gebruik te maken van een univariate latente structuur voor efficiënte inferentie.

Prithvi Raj2026-03-10🤖 cs.LG

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

Dit paper introduceert GLMask, een semi-zelftoezicht-leringsaanpak die met minimale handmatige annotatie een state-of-the-art instantiesegmentatiemodel voor tarwekoppen ontwikkelt en bovendien aanzienlijke prestatieverbeteringen boekt op het algemene COCO-dataset.

Keyhan Najafian, Farhad Maleki, Lingling Jin, Ian Stavness2026-03-10🤖 cs.LG

← Vorige Volgende →