Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

受人类大脑模块化组织启发,Mozart 提出了一种面向 3.5D 晶圆级芯片架构的算法 - 硬件协同设计框架,通过专家分配策略、细粒度调度机制及异构模块自适应共置,有效解决了混合专家模型(MoE)训练中的稀疏性挑战并显著提升了大规模语言模型的并行化效率与资源利用率。

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

本文提出了安全保证手术策略(SSP)框架,通过结合神经常微分方程学习的不确定性感知动力学模型与鲁棒控制障碍函数(CBF),在严格满足行为与空间安全约束的前提下,实现了机器人辅助手术中数据驱动策略的安全部署。

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

本文提出了名为 DeepEarth 的自监督多模态世界模型,其核心创新是能够将 3D 多分辨率哈希编码扩展至时间维度的 Earth4D 行星级 4D 时空位置编码器,该模型在生态预测基准测试中取得了最先进性能,甚至超越了在更大规模数据上预训练的多模态基础模型。

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

该论文提出了一种名为 CAPL 的框架,通过引入可选择的图像令牌交互注意力机制和基于跨图像建模的偏好优化策略,有效增强了大型视觉语言模型在多图像任务中的跨图像关联感知能力,从而显著缓解了幻觉问题并提升了整体性能。

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

该论文提出了一种基于大语言模型的自动化统一框架,通过结合关键词查询、API 数据检索及 LLM 文本分类技术,高效构建可扩展的领域特定开放科学数据库,并在农业与作物产量等任务中验证了其能显著减少人工工作量且与专家 curated 数据库高度一致。

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico Gomez2026-03-10💻 cs

Animating Petascale Time-varying Data on Commodity Hardware with LLM-assisted Scripting

该论文提出了一种结合大语言模型辅助脚本的通用框架,使领域科学家能够在普通工作站上高效生成超大规模(PB 级)时变科学数据(如 NASA 气候模型)的 3D 动画,从而显著降低了对高性能计算资源和可视化专业技能的依赖。

Ishrat Jahan Eliza, Xuan Huang, Aashish Panta, Alper Sahistan, Zhimin Li, Amy A. Gooch, Valerio Pascucci2026-03-10💻 cs

SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer

本文提出了 SODA(敏感性导向动态加速)方法,通过构建跨时间步、层和模块的细粒度敏感性误差建模框架,利用动态规划自适应优化缓存与剪枝策略,从而在显著提升扩散 Transformer 推理效率的同时,有效克服了现有固定启发式方法导致的生成质量下降问题。

Tong Shao, Yusen Fu, Guoying Sun, Jingde Kong, Zhuotao Tian, Jingyong Su2026-03-10💻 cs

GuideTWSI: A Diverse Tactile Walking Surface Indicator Dataset from Synthetic and Real-World Images for Blind and Low-Vision Navigation

该论文针对现有触觉行走表面指示器(TWSI)数据集在视角和地域类型(如缺乏北美/欧洲常见的圆点警示)上的局限性,提出了一个结合合成与真实图像、涵盖多样化视角和警示类型的 GuideTWSI 数据集,以显著提升盲人和低视力人群导航辅助系统的检测泛化能力。

Hochul Hwang, Soowan Yang, Anh N. H. Nguyen, Parth Goel, Krisha Adhikari, Sunghoon I. Lee, Joydeep Biswas, Nicholas A. Giudice, Donghyun Kim2026-03-10💻 cs