Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

该论文揭示了大型视觉语言模型(LVLMs)存在一种通过语义槽填充将看似无害的视觉块组装成恶意内容的新型漏洞,并据此提出了一种名为 StructAttack 的黑盒单查询越狱框架,该框架通过将有害查询分解为良性槽位并嵌入结构化视觉提示,成功诱导模型绕过安全机制生成有害输出。

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

本文提出了 MAS-H2,一种基于分层多智能体系统的云原生自动扩缩容方案,它通过将业务策略转化为全局效用函数并实施端到端的预测性规划与执行,有效解决了传统方案中策略与资源脱节的问题,在降低 CPU 负载峰值、应对突发流量及实现零停机战略迁移方面显著优于原生 Kubernetes 自动扩缩容机制。

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

该论文提出了一种基于 NVIDIA Omniverse 构建的阿尔及尔国际机场高保真数字孪生体的合成数据生成管道,用于解决行李推车检测中的隐私与数据多样性难题,实验表明结合少量真实标注数据的混合训练策略在显著降低标注成本的同时,其检测精度(mAP@50 达 0.94)可媲美甚至超越全量真实数据基线。

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

本文提出了一种名为 FedCEF 的新型联邦复合优化算法,通过解耦近端更新与通信、结合误差反馈与控制变量机制,有效解决了非凸复合优化中非平滑正则化、数据异构及有偏压缩带来的挑战,在极端压缩比下实现了通信高效且收敛稳健的分布式训练。

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本文介绍了 Megatron Core 中针对混合专家(MoE)模型可扩展训练的系统级协同优化方案,通过整合内存、通信和计算层面的多项创新技术,在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

该论文提出了一种结合神经评论家估计与自然策略梯度的原始 - 对偶算法,利用神经切线核理论证明了在一般策略参数化和多层神经网络评论家设置下,无限时域约束马尔可夫决策过程(CMDP)的平均奖励问题具有全局收敛性及约束违反率保证。

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG