X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Dit paper introduceert X-MethaneWet, het eerste cross-schaal wereldwijde benchmarkdataset voor methaanemissies uit wetlands dat fysiek gebaseerde simulaties en waarnemingen combineert om AI-modellen te trainen en transfer learning-technieken te evalueren voor verbeterde klimaatmodellering.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Dit artikel introduceert een nieuwe methode die prompt-injectie-aanvallen op grote taalmodellen effectiever bestrijdt door het bevoorrechte instructieniveau niet alleen aan de invoer, maar ook in de tussenliggende neurale representaties te coderen, wat leidt tot een aanzienlijke vermindering van de aanvalssuccesratio's zonder de nuttigheid van het model te schaden.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Dit paper introduceert een nieuwe, plug-and-play adaptieve correctiemethode die de uitkomsten van neurale operatoren garandeert dat ze fundamentele behoudswetten naleven, waardoor zowel de nauwkeurigheid als de stabiliteit van de oplossingen voor partiële differentiaalvergelijkingen aanzienlijk worden verbeterd ten opzichte van bestaande technieken.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Dit paper introduceert MMTU, een uitgebreid benchmark met meer dan 28.000 vragen over 25 real-world tabellataken, om de complexiteit van het begrijpen, redeneren en manipuleren van tabellen door geavanceerde AI-modellen te evalueren en aan te tonen dat er nog aanzienlijke ruimte voor verbetering is.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

Dit paper introduceert EROICA, het eerste online systeem voor het oplossen van prestatieproblemen bij het trainen van grote modellen op schaal, dat door middel van gedetailleerde profilering en differentiële observabiliteit succesvol hardware- en softwarefouten diagnoseert op productiesystemen met ongeveer 100.000 GPU's.

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan Zhai2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Dit paper introduceert BemaGANv2, een geavanceerde GAN-gebaseerde vocoder voor hoogwaardige en langdurige audio-generatie die gebruikmaakt van innovatieve architecturale wijzigingen en een systematische evaluatie van discriminatorscombinaties om temporale coherentie en harmonische structuur te verbeteren.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback

Dit artikel introduceert de efficiënte algoritmen Slate-GLM-OFU en Slate-GLM-TS voor het logistische contextuele slate-bandit-probleem, die door lokale planning en globale learing een lage regret van O~(T)\tilde{O}(\sqrt{T}) bereiken met een lage rekentijd per ronde, wat zowel theoretisch wordt onderbouwd als empirisch wordt geverifieerd in synthetische experimenten en praktische toepassingen voor het selecteren van in-context voorbeelden in taalmodellen.

Tanmay Goyal, Gaurav Sinha2026-03-10🤖 cs.LG