cs.LG 篇论文 | Gist.Science

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

该论文提出了一种基于生成对抗网络与残差自编码器的半监督异常检测框架，通过仅使用标称样本训练，成功在制药行业高速吹灌封（BFS）生产线上实现了满足 500 毫秒时序约束的高精度在线缺陷检测与定位。

Niccolò Ferrari, Nicola Zanarini, Michele Fraccaroli, Alice Bizzarri, Evelina Lamma2026-03-10🤖 cs.LG

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

本文提出了一种基于分析驱动的引擎声音生成框架，通过从真实录音中提取谐波结构并驱动参数化合成器，构建了包含精确转速与扭矩标注的“程序化引擎声音数据集”，以解决高质量标注数据稀缺的问题并支持相关领域的研究与开发。

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

该论文揭示了大型视觉语言模型（LVLMs）存在一种通过语义槽填充将看似无害的视觉块组装成恶意内容的新型漏洞，并据此提出了一种名为 StructAttack 的黑盒单查询越狱框架，该框架通过将有害查询分解为良性槽位并嵌入结构化视觉提示，成功诱导模型绕过安全机制生成有害输出。

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

该论文提出了难度缩放的分段式 GRPO（DSS-GRPO）方法，通过将奖励信号分解为思维与回答两个独立部分并施加难度感知调整，在有效压缩思维链长度的同时避免了模型回答质量的下降。

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

本文提出了一种名为 MetaSort 的新算法，通过结合自适应电平交叉压缩、潜在特征表示以及利用数据几何信息的元迁移学习框架，同时实现了神经脉冲波形的高效非均匀压缩与少样本分类，并在体内数据实验中验证了其优异性能及片上超低功耗实现的潜力。

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

本文提出了 TT-Sparse，一种利用可微真值表和新型软 TopK 算子来端到端学习稀疏规则模型的神经网络模块，该方法在保持高效计算和精确符号规则提取能力的同时，在多个数据集上实现了优于现有最先进方法的预测性能与更低的模型复杂度。

Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

本文提出了 MAS-H2，一种基于分层多智能体系统的云原生自动扩缩容方案，它通过将业务策略转化为全局效用函数并实施端到端的预测性规划与执行，有效解决了传统方案中策略与资源脱节的问题，在降低 CPU 负载峰值、应对突发流量及实现零停机战略迁移方面显著优于原生 Kubernetes 自动扩缩容机制。

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

该论文提出了一种将视觉信号编码为冻结生成模型低秩适配参数的函数式隐式表示框架，通过将其哈希为紧凑向量，实现了极低码率下的高感知视频压缩，并构建了连接视觉压缩与生成的统一范式。

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

该论文提出了一种名为 SMAT 的四阶段多智能体训练课程，通过模拟人类自然适应过程来训练髋部外骨骼控制器，使其在无需针对特定用户重新训练的情况下，即可在物理实验中实现一致的辅助效果并显著降低肌肉激活度。

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics

该论文提出了一种基于硅光学的新型扩散模型加速器，实验表明其在能效和吞吐量上分别比现有最先进加速器提升了至少 3 倍和 5.5 倍，从而有效解决了扩散模型在电子平台上推理能耗高的问题。

Tharini Suresh, Salma Afifi, Sudeep Pasricha2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

本文提出了一种结合强化学习与数据驱动验证的框架，用于训练模拟环境下的外骨骼控制器以减小生物关节力矩，并通过公开步态数据集验证了其在不同速度与坡度下对关节力矩预测的高度一致性，同时揭示了从模拟到现实转移中存在的挑战。

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

本文提出了名为 HELIX 的层次化进化强化学习框架，通过结合上下文经验构建高质量候选解池与迭代策略优化，在圆堆积等开放科学问题及机器学习基准测试中，以较小模型实现了超越现有方法（包括 GPT-4o）的卓越性能。

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

该论文提出了一种基于 NVIDIA Omniverse 构建的阿尔及尔国际机场高保真数字孪生体的合成数据生成管道，用于解决行李推车检测中的隐私与数据多样性难题，实验表明结合少量真实标注数据的混合训练策略在显著降低标注成本的同时，其检测精度（mAP@50 达 0.94）可媲美甚至超越全量真实数据基线。

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

本文提出了一种名为 FedCEF 的新型联邦复合优化算法，通过解耦近端更新与通信、结合误差反馈与控制变量机制，有效解决了非凸复合优化中非平滑正则化、数据异构及有偏压缩带来的挑战，在极端压缩比下实现了通信高效且收敛稳健的分布式训练。

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

这篇综述论文通过统一的评估框架，批判性地对比了求解偏微分方程的经典数值方法与机器学习方法在认识论上的根本差异，阐明了两者在互补性、混合设计原则及未来前沿方向上的关键见解。

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

该论文提出了一种统一的理论框架，通过贝叶斯最优集和遗憾转移量化评估指标间的关系，旨在解决离线指标提升无法转化为在线性能提升的“指标不匹配”问题，从而确保离线优化与在线目标在理论上的一致性。

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

该论文针对现代计算系统中日益严重的内存瓶颈问题，主张将微架构设计从数据无关转向数据驱动和数据感知，通过提出四种结合轻量级机器学习与数据语义特征的机制（如强化学习预取器和感知器预测器），显著提升了系统的性能与能效。

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本文介绍了 Megatron Core 中针对混合专家（MoE）模型可扩展训练的系统级协同优化方案，通过整合内存、通信和计算层面的多项创新技术，在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Global Convergence of Average Reward Constrained MDPs with Neural Critic and General Policy Parameterization

该论文提出了一种结合神经评论家估计与自然策略梯度的原始 - 对偶算法，利用神经切线核理论证明了在一般策略参数化和多层神经网络评论家设置下，无限时域约束马尔可夫决策过程（CMDP）的平均奖励问题具有全局收敛性及约束违反率保证。

Anirudh Satheesh, Pankaj Kumar Barman, Washim Uddin Mondal, Vaneet Aggarwal2026-03-10🤖 cs.LG

Step-Size Decay and Structural Stagnation in Greedy Sparse Learning

本文从稀疏学习的视角重新审视了幂松弛贪婪算法中步长衰减过快（ $\alpha>1$ ）导致的收敛失败问题，通过理论推导与数值实验揭示了即使在高维稀疏设置下，过度衰减的步长调度也会因特征相干性引发结构性停滞现象。

Pablo M. Berná2026-03-10🤖 cs.LG