Integration of deep generative Anomaly Detection algorithm in high-speed industrial line
该论文提出了一种基于生成对抗网络与残差自编码器的半监督异常检测框架,通过仅使用标称样本训练,成功在制药行业高速吹灌封(BFS)生产线上实现了满足 500 毫秒时序约束的高精度在线缺陷检测与定位。
9890 篇论文
该论文提出了一种基于生成对抗网络与残差自编码器的半监督异常检测框架,通过仅使用标称样本训练,成功在制药行业高速吹灌封(BFS)生产线上实现了满足 500 毫秒时序约束的高精度在线缺陷检测与定位。
本文提出了一种基于分析驱动的引擎声音生成框架,通过从真实录音中提取谐波结构并驱动参数化合成器,构建了包含精确转速与扭矩标注的“程序化引擎声音数据集”,以解决高质量标注数据稀缺的问题并支持相关领域的研究与开发。
该论文揭示了大型视觉语言模型(LVLMs)存在一种通过语义槽填充将看似无害的视觉块组装成恶意内容的新型漏洞,并据此提出了一种名为 StructAttack 的黑盒单查询越狱框架,该框架通过将有害查询分解为良性槽位并嵌入结构化视觉提示,成功诱导模型绕过安全机制生成有害输出。
该论文提出了难度缩放的分段式 GRPO(DSS-GRPO)方法,通过将奖励信号分解为思维与回答两个独立部分并施加难度感知调整,在有效压缩思维链长度的同时避免了模型回答质量的下降。
本文提出了一种名为 MetaSort 的新算法,通过结合自适应电平交叉压缩、潜在特征表示以及利用数据几何信息的元迁移学习框架,同时实现了神经脉冲波形的高效非均匀压缩与少样本分类,并在体内数据实验中验证了其优异性能及片上超低功耗实现的潜力。
本文提出了 TT-Sparse,一种利用可微真值表和新型软 TopK 算子来端到端学习稀疏规则模型的神经网络模块,该方法在保持高效计算和精确符号规则提取能力的同时,在多个数据集上实现了优于现有最先进方法的预测性能与更低的模型复杂度。
本文提出了 MAS-H2,一种基于分层多智能体系统的云原生自动扩缩容方案,它通过将业务策略转化为全局效用函数并实施端到端的预测性规划与执行,有效解决了传统方案中策略与资源脱节的问题,在降低 CPU 负载峰值、应对突发流量及实现零停机战略迁移方面显著优于原生 Kubernetes 自动扩缩容机制。
该论文提出了一种将视觉信号编码为冻结生成模型低秩适配参数的函数式隐式表示框架,通过将其哈希为紧凑向量,实现了极低码率下的高感知视频压缩,并构建了连接视觉压缩与生成的统一范式。
该论文提出了一种名为 SMAT 的四阶段多智能体训练课程,通过模拟人类自然适应过程来训练髋部外骨骼控制器,使其在无需针对特定用户重新训练的情况下,即可在物理实验中实现一致的辅助效果并显著降低肌肉激活度。
该论文提出了一种基于硅光学的新型扩散模型加速器,实验表明其在能效和吞吐量上分别比现有最先进加速器提升了至少 3 倍和 5.5 倍,从而有效解决了扩散模型在电子平台上推理能耗高的问题。
本文提出了一种结合强化学习与数据驱动验证的框架,用于训练模拟环境下的外骨骼控制器以减小生物关节力矩,并通过公开步态数据集验证了其在不同速度与坡度下对关节力矩预测的高度一致性,同时揭示了从模拟到现实转移中存在的挑战。
本文提出了名为 HELIX 的层次化进化强化学习框架,通过结合上下文经验构建高质量候选解池与迭代策略优化,在圆堆积等开放科学问题及机器学习基准测试中,以较小模型实现了超越现有方法(包括 GPT-4o)的卓越性能。
该论文提出了一种基于 NVIDIA Omniverse 构建的阿尔及尔国际机场高保真数字孪生体的合成数据生成管道,用于解决行李推车检测中的隐私与数据多样性难题,实验表明结合少量真实标注数据的混合训练策略在显著降低标注成本的同时,其检测精度(mAP@50 达 0.94)可媲美甚至超越全量真实数据基线。
本文提出了一种名为 FedCEF 的新型联邦复合优化算法,通过解耦近端更新与通信、结合误差反馈与控制变量机制,有效解决了非凸复合优化中非平滑正则化、数据异构及有偏压缩带来的挑战,在极端压缩比下实现了通信高效且收敛稳健的分布式训练。
这篇综述论文通过统一的评估框架,批判性地对比了求解偏微分方程的经典数值方法与机器学习方法在认识论上的根本差异,阐明了两者在互补性、混合设计原则及未来前沿方向上的关键见解。
该论文提出了一种统一的理论框架,通过贝叶斯最优集和遗憾转移量化评估指标间的关系,旨在解决离线指标提升无法转化为在线性能提升的“指标不匹配”问题,从而确保离线优化与在线目标在理论上的一致性。
该论文针对现代计算系统中日益严重的内存瓶颈问题,主张将微架构设计从数据无关转向数据驱动和数据感知,通过提出四种结合轻量级机器学习与数据语义特征的机制(如强化学习预取器和感知器预测器),显著提升了系统的性能与能效。
本文介绍了 Megatron Core 中针对混合专家(MoE)模型可扩展训练的系统级协同优化方案,通过整合内存、通信和计算层面的多项创新技术,在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。
该论文提出了一种结合神经评论家估计与自然策略梯度的原始 - 对偶算法,利用神经切线核理论证明了在一般策略参数化和多层神经网络评论家设置下,无限时域约束马尔可夫决策过程(CMDP)的平均奖励问题具有全局收敛性及约束违反率保证。
本文从稀疏学习的视角重新审视了幂松弛贪婪算法中步长衰减过快()导致的收敛失败问题,通过理论推导与数值实验揭示了即使在高维稀疏设置下,过度衰减的步长调度也会因特征相干性引发结构性停滞现象。