Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

Dit paper introduceert StructAttack, een black-box jailbreak-methode die kwetsbaarheden in Large Vision-Language Models exploiteert door schadelijke inhoud te verbergen in ogenschijnlijk onschadelijke visuele structuren die het model zelf tot een gevaarlijke output assembleert.

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

Dit paper introduceert MAS-H2, een hiërarchisch multi-agent systeem dat de strategische kloof in cloud-native autoscaling overbrugt door bedrijfsbeleidsdoelen om te zetten in proactieve, gecoördineerde schaalplannen, wat resulteert in aanzienlijk lagere CPU-belasting en kostenefficiëntere, onderbrekingsvrije migraties vergeleken met traditionele Kubernetes-oplossingen.

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Dit artikel introduceert een nieuw raamwerk voor visuele representatie waarbij video's worden gecodeerd als functies met lage-rang aanpassingen op een bevroren generatief model, waardoor compressie met uiterst lage bitrates mogelijk is en een brug wordt geslagen tussen beeldcompressie en generatie.

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

Het paper introduceert HELIX, een hiërarchisch evolutionair reinforcement learning-framework dat in-context ervaringen combineert met beleidsverfijning om open-ended wetenschappelijke problemen effectiever op te lossen dan bestaande methoden, zoals aangetoond door state-of-the-art resultaten op de cirkelpakkingstaak en verbeterde prestaties op machine learning-benchmarks.

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Dit artikel introduceert een synthetische data-pipeline op basis van een digitale tweeling van de luchthaven van Algiers die, in combinatie met YOLO-OBB en gemengde training, de annotatie-inspanning voor het detecteren van bagagewagentjes met 25 tot 35 procent verlaagt terwijl de prestaties gelijk blijven aan of beter zijn dan die van modellen getraind op volledige real-world datasets.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Dit kritisch overzicht vergelijkt klassieke numerieke methoden en machine learning-benaderingen voor het oplossen van partiële differentiaalvergelijkingen, benadrukt hun fundamentele epistemologische verschillen en biedt een raamwerk voor het ontwerpen van hybride methoden die de sterke punten van beide paradigma's combineren.

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

Dit paper introduceert Megatron Core, een schaalbaar en productieklaar open-source framework dat geïntegreerde optimalisaties voor geheugen, communicatie en berekening combineert om de training van Mixture-of-Experts-modellen tot triljoenen parameters op duizenden GPU's efficiënt te maken.

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

Dit paper introduceert een primal-dual natural actor-critic algoritme met neurale critics dat, voor het eerst, globale convergentie en cumulatieve constraint-schendingen van O~(T1/4)\tilde{\mathcal{O}}(T^{-1/4}) garandeert voor onbepaalde-horizon Constrained MDP's met algemene beleidsparametrisaties en multi-layer neurale netwerken.

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG