cs.LG papers | Gist.Science

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

Leveraging chaotic transients in the training of artificial neural networks

Dit artikel toont aan dat het trainen van kunstmatige neurale netwerken met ongebruikelijk grote leersnelheden, waardoor ze zich in een overgangsregime van chaotische dynamica bevinden, de balans tussen exploratie en exploitatie verbetert en zo de trainingsduur aanzienlijk verkort.

Pedro Jiménez-González, Miguel C. Soriano, Lucas Lacasa2026-03-10🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

Dit paper introduceert EROICA, het eerste online systeem voor het oplossen van prestatieproblemen bij het trainen van grote modellen op schaal, dat door middel van gedetailleerde profilering en differentiële observabiliteit succesvol hardware- en softwarefouten diagnoseert op productiesystemen met ongeveer 100.000 GPU's.

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan Zhai2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Dit paper introduceert BemaGANv2, een geavanceerde GAN-gebaseerde vocoder voor hoogwaardige en langdurige audio-generatie die gebruikmaakt van innovatieve architecturale wijzigingen en een systematische evaluatie van discriminatorscombinaties om temporale coherentie en harmonische structuur te verbeteren.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Dit paper introduceert Co-LoRA, een methode voor gepersonaliseerd federatief leren die heterogene data en modelarchitecturen overbrugt door middel van een taak-relevantiebewuste aggregatiestrategie en een dimensie-invariante module, wat resulteert in superieure prestaties vergeleken met bestaande methoden.

Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars2026-03-10🤖 cs.LG

Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback

Dit artikel introduceert de efficiënte algoritmen Slate-GLM-OFU en Slate-GLM-TS voor het logistische contextuele slate-bandit-probleem, die door lokale planning en globale learing een lage regret van $\tilde{O}(\sqrt{T})$ bereiken met een lage rekentijd per ronde, wat zowel theoretisch wordt onderbouwd als empirisch wordt geverifieerd in synthetische experimenten en praktische toepassingen voor het selecteren van in-context voorbeelden in taalmodellen.

Tanmay Goyal, Gaurav Sinha2026-03-10🤖 cs.LG

Sharpness-Aware Machine Unlearning

Deze paper introduceert Sharp MinMax, een methode die Sharpness-Aware Minimization (SAM) combineert met scherpe maximalisatie om machine unlearning te verbeteren door het model te splitsen in een deel dat retain-signaals leert en een deel dat forget-signaals verwijdert, wat resulteert in superieure prestaties, verminderde feature-entanglement en sterkere weerstand tegen aanvallen vergeleken met bestaande methoden.

Haoran Tang, Rajiv Khanna2026-03-10🤖 cs.LG

Kolmogorov-Arnold Energy Models: Fast, Interpretable Generative Modeling

Dit paper introduceert het Kolmogorov-Arnold Energy Model (KAEM), een nieuwe generatieve aanpak die de snelheid en interpreteerbaarheid van VAE's combineert met de expressiviteit van Energy-based Models door gebruik te maken van een univariate latente structuur voor efficiënte inferentie.

Prithvi Raj2026-03-10🤖 cs.LG

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

Dit paper introduceert GLMask, een semi-zelftoezicht-leringsaanpak die met minimale handmatige annotatie een state-of-the-art instantiesegmentatiemodel voor tarwekoppen ontwikkelt en bovendien aanzienlijke prestatieverbeteringen boekt op het algemene COCO-dataset.

Keyhan Najafian, Farhad Maleki, Lingling Jin, Ian Stavness2026-03-10🤖 cs.LG

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Deze paper introduceert SamS, een efficiënt algoritme dat de prestaties van Direct Preference Optimization (DPO) voor grote taalmodellen verbetert door trainingsstalen adaptief en dynamisch te plannen op basis van de evoluerende toestand van het model, zonder de kern van het DPO-algoritme te wijzigen.

Zixuan Huang, Yikun Ban, Lean Fu, Xiaojie Li, Zhongxiang Dai, Jianxin Li, Deqing Wang2026-03-10🤖 cs.LG

DemoDiffusion: One-Shot Human Imitation using pre-trained Diffusion Policy

DemoDiffusion is een methode die robots in staat stelt om complexe manipulatieopdrachten te leren door een enkele menselijke demonstratie na te bootsen, waarbij kinematische retargeting wordt gecombineerd met een vooringeschoolde diffusiepolicy om robuuste aanpassing mogelijk te maken zonder specifieke training of gekoppelde mens-robotdata.

Sungjae Park, Homanga Bharadhwaj, Shubham Tulsiani2026-03-10🤖 cs.LG

Adopting a human developmental visual diet yields robust, shape-based AI vision

Dit onderzoek toont aan dat kunstmatige visiesystemen robuuster en meer op de mens gelijkend worden door ze te trainen met een ontwikkelingsvisueel dieet dat is geïnspireerd op de menselijke visuele ontwikkeling, wat leidt tot een sterkere focus op vorm in plaats van textuur en een betere weerstand tegen verstoringen.

Zejin Lu, Sushrut Thorat, Radoslaw M Cichy, Tim C Kietzmann2026-03-10🤖 cs.LG

Noisy PDE Training Requires Bigger PINNs

Dit artikel toont aan dat Physics-Informed Neural Networks (PINNs) voor het oplossen van PDE's met ruis in de data een minimale netwerkgrootte vereisen om de trainingsfout onder de ruisvariatie te brengen, waarbij het simpelweg verhogen van het aantal steekproeven geen "gratis lunch" biedt.

Sebastien Andre-Sloan, Anirbit Mukherjee, Matthew Colbrook2026-03-10🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

Dit paper introduceert TableEG, een framework dat gebruikmaakt van fijngefineerde grote taalmodellen om authentieke fouten in tabulaire data te genereren, waardoor een robuust en betrouwbaar benchmark voor het evalueren van data-cleaning technieken wordt gecreëerd.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin Tong2026-03-10🤖 cs.LG

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Dit artikel introduceert MCULoRA, een robuust raamwerk voor emotionele herkenning met onvolledige multimodale data dat door middel van ontkoppeling en dynamische aanpassing van laag-rang adaptatie de prestaties van bestaande methoden aanzienlijk verbetert.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Dit paper introduceert een methode genaamd Self-Grounded Verification (SGV) die de neiging van multimodale taalmodellen om agenten-acties te overdreven te valideren (de 'agreement bias') vermindert, waardoor de nauwkeurigheid van verifiers en de prestaties van agenten in taken zoals webnavigatie en robotica aanzienlijk worden verbeterd.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Flow Matching Meets Biology and Life Science: A Survey

Dit artikel biedt het eerste uitgebreide overzicht van de recente ontwikkelingen in flow matching en de toepassing ervan op biologische domeinen, waaronder sequentiemodellering, molecuulontwerp en eiwitgeneratie.

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

Deze paper introduceert een boomgebaseerde aanpak voor weak-to-strong generalisatie die sterke modellen traint met zowel succes- als falingspaden van zwakke modellen, gebruikmakend van Monte Carlo Tree Search om de besluitvorming en redeneervermogens in complexe interactieve omgevingen te optimaliseren.

Ruimeng Ye, Zihan Wang, Yang Xiao, Zinan Ling, Manling Li, Bo Hui2026-03-10🤖 cs.LG

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Dit artikel onderzoekt hoe kwaadaardige auditees de schijn van eerlijkheid kunnen wekken door manipulatie van datasets, formaliseert deze aanval als een wiskundig projectieprobleem, en evalueert statistische methoden om dergelijke vertekende steekproeven te detecteren.

Valentin Lafargue, Adriana Laurindo Monteiro, Emmanuelle Claeys, Laurent Risser, Jean-Michel Loubes2026-03-10🤖 cs.LG

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

Deze paper introduceert een dynamisch, automatisch en systematisch (DAS) red-teaming-framework dat, in tegenstelling tot statische benchmarks, de kwetsbaarheden van medische taalmodellen blootlegt door te tonen dat hoge prestaties op bestaande tests niet garanderen dat deze modellen betrouwbaar zijn in realistische, dynamische klinische scenario's.

Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG

← Vorige Volgende →