Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures
受人类大脑模块化组织启发,Mozart 提出了一种面向 3.5D 晶圆级芯片架构的算法 - 硬件协同设计框架,通过专家分配策略、细粒度调度机制及异构模块自适应共置,有效解决了混合专家模型(MoE)训练中的稀疏性挑战并显著提升了大规模语言模型的并行化效率与资源利用率。
3952 篇论文
受人类大脑模块化组织启发,Mozart 提出了一种面向 3.5D 晶圆级芯片架构的算法 - 硬件协同设计框架,通过专家分配策略、细粒度调度机制及异构模块自适应共置,有效解决了混合专家模型(MoE)训练中的稀疏性挑战并显著提升了大规模语言模型的并行化效率与资源利用率。
该研究通过“超级技能栈”框架分析 80 个学生设计团队的反思,发现生成式 AI 主要作为认知加速器辅助设计早期阶段,而人类凭借能动性、领域知识、想象力和品味等核心能力在理解语境、验证输出及优化方案中发挥不可替代的关键作用。
本文提出了 OV-DEIM,一种基于 DEIMv2 框架并集成视觉语言模型与 GridSynthetic 数据增强策略的实时端到端 DETR 风格开放词汇目标检测器,在保持低延迟的同时显著提升了检测性能,特别是在稀有类别上的表现。
该论文针对现有基于大语言模型的 Web 智能体因扁平记忆结构导致跨网站泛化能力不足的问题,提出了一种名为分层记忆树(HMT)的框架,通过将记忆解耦为意图、阶段和行动三个层级,实现了逻辑规划与动作执行的分离,从而显著提升了智能体在跨网站和跨域场景下的任务泛化能力。
该论文提出了一种名为 TFM 的新型越狱攻击框架,通过利用文生视频模型在仅指定起始和结束帧的稀疏提示下自主补全中间有害内容的“时间轨迹填充”漏洞,成功绕过了现有内容过滤机制并显著提升了攻击成功率。
本文提出利用 eBPF 系统级监控技术,揭示了传统可搜索对称加密(SSE)威胁模型中未被涵盖的新型泄漏模式,并证明了这些底层系统行为信息可被用于增强现有的泄漏滥用攻击,从而强调了在 SSE 防御设计中必须考虑系统级暴露风险。
本文提出了安全保证手术策略(SSP)框架,通过结合神经常微分方程学习的不确定性感知动力学模型与鲁棒控制障碍函数(CBF),在严格满足行为与空间安全约束的前提下,实现了机器人辅助手术中数据驱动策略的安全部署。
该论文通过分析 377 个 YouTube 视频,揭示了创作者社区如何集体构建关于利用生成式 AI 进行内容变现的知识体系,识别出十种共享应用场景,并探讨了其中涉及的收入主张不可验证、内容盗用及作者身份规范转变等结构性张力。
本文提出了名为 DeepEarth 的自监督多模态世界模型,其核心创新是能够将 3D 多分辨率哈希编码扩展至时间维度的 Earth4D 行星级 4D 时空位置编码器,该模型在生态预测基准测试中取得了最先进性能,甚至超越了在更大规模数据上预训练的多模态基础模型。
本文提出了一种名为 TacDexGrasp 的基于触觉反馈和锥规划(SOCP)的控制器,通过主动约束各接触点的切向与法向力比值,无需显式扭矩建模或滑移检测即可实现多指灵巧手对未知物体的稳健且柔顺的抓取。
本文介绍了 AIReSim,一款专为大规模 AI 集群设计的离散事件模拟器,旨在通过系统性地评估故障、恢复、调度及修复过程中的各种参数配置,帮助设计者优化系统可靠性、确定关键改进点并支持容量规划等“假设分析”场景。
该论文提出了一种融合全局动态特征与多源局部信息的细粒度微表情三维重建方法,通过动态编码模块利用宏观表情先验知识缓解数据稀缺问题,并借助动态引导的网格变形模块自适应优化细节,在几何精度与感知细节上均超越了现有最先进方法。
本文通过访谈和参与式设计研究,探讨了利用改装方案弥补车载智能传感器局限性的潜力,并据此提出了指导未来智能座舱改装设计的需求与规范。
该论文提出了一种名为 CAPL 的框架,通过引入可选择的图像令牌交互注意力机制和基于跨图像建模的偏好优化策略,有效增强了大型视觉语言模型在多图像任务中的跨图像关联感知能力,从而显著缓解了幻觉问题并提升了整体性能。
该论文提出了一种通信网络感知框架,通过将传感器分组并优化路由以避免同一簇内传感器共享故障链路,结合最优奇异值阈值法进行低秩矩阵补全,从而显著提升了配电网在通信故障下的数据恢复精度。
该论文提出了一种基于大语言模型的自动化统一框架,通过结合关键词查询、API 数据检索及 LLM 文本分类技术,高效构建可扩展的领域特定开放科学数据库,并在农业与作物产量等任务中验证了其能显著减少人工工作量且与专家 curated 数据库高度一致。
该论文提出了一种结合大语言模型辅助脚本的通用框架,使领域科学家能够在普通工作站上高效生成超大规模(PB 级)时变科学数据(如 NASA 气候模型)的 3D 动画,从而显著降低了对高性能计算资源和可视化专业技能的依赖。
该论文提出了一种结合多周期性学习与双向数字孪生原型锚定的新框架,通过元训练与测试时适应策略,有效解决了工业场景下仅凭极少量样本进行故障诊断的难题。
本文提出了 SODA(敏感性导向动态加速)方法,通过构建跨时间步、层和模块的细粒度敏感性误差建模框架,利用动态规划自适应优化缓存与剪枝策略,从而在显著提升扩散 Transformer 推理效率的同时,有效克服了现有固定启发式方法导致的生成质量下降问题。
该论文针对现有触觉行走表面指示器(TWSI)数据集在视角和地域类型(如缺乏北美/欧洲常见的圆点警示)上的局限性,提出了一个结合合成与真实图像、涵盖多样化视角和警示类型的 GuideTWSI 数据集,以显著提升盲人和低视力人群导航辅助系统的检测泛化能力。