Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

该论文介绍了 Intern-S1-Pro,这是首个万亿参数规模的科学多模态基础模型,它通过高效的基础设施支持实现了通用推理与超过 100 项专业科学任务的深度融合,在开源通用能力上跻身顶尖行列,并在专业科学任务深度上超越了专有模型。

Yicheng Zou, Dongsheng Zhu, Lin Zhu, Tong Zhu, Yunhua Zhou, Peiheng Zhou, Xinyu Zhou, Dongzhan Zhou, Zhiwang Zhou, Yuhao Zhou, Bowen Zhou, Zhanping Zhong, Zhijie Zhong, Haiteng Zhao, Penghao Zhao, Xia
发布于 2026-03-27
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

想象一下,如果科学界有一位**“超级博士”**,他不仅拥有哈佛、MIT 和牛津所有图书馆的藏书,还能同时看懂显微镜下的细胞、卫星拍下的地球、化学分子的结构图,甚至能听懂心电图的“心跳声”。

这就是 Intern-S1-Pro,一篇来自上海人工智能实验室的论文介绍的全新模型。

为了让你轻松理解这项突破,我们可以用几个生动的比喻来拆解它:

1. 它是谁?(万亿参数的“超级大脑”)

以前的 AI 模型像是一个**“博学的大学生”,什么都能聊,但遇到高深的科学问题(比如设计新药或预测地震)就会卡壳。
Intern-S1-Pro 是一个
“拥有 1 万亿个神经元”的超级大脑**。

  • 比喻:如果把普通模型比作一辆家用轿车,那 Intern-S1-Pro 就是一辆重型航天飞机。它不仅能载人(处理日常对话),还能把人类送上火星(解决复杂的科学难题)。
  • 能力:它精通化学、材料、生命科学和地球科学等 100 多种专业领域,甚至能像真正的科学家一样,自主规划实验步骤(Agent 能力)。

2. 它是怎么造出来的?(“分班制”与“超级扩容”)

要把一个模型做得这么大,最大的难点是**“怎么让这么多专家一起工作而不吵架”**。

  • 专家混合(MoE)的困境:想象一个拥有 1000 名专家的会议室。以前,如果让这 1000 个人同时说话,会议室会乱成一锅粥,有的专家累死,有的闲死(负载不均),甚至导致系统崩溃。
  • 分组路由(Group Routing)的妙计:Intern-S1-Pro 发明了一种**“分班制”**。它把 1000 名专家分成 8 个大组,每个组里只选最顶尖的 1-2 人发言。
    • 效果:就像把大会议室变成了 8 个独立的小会议室,每个人都能专心工作,既不会累死,也不会冷场,训练过程变得超级稳定。
  • 直通估计器(STE):为了让这些专家学得更聪明,他们发明了一种**“全知视角的反馈机制”**。以前,只有被选中的专家能收到老师的表扬(梯度更新),没被选中的就不知道错哪了。现在,所有专家都能收到反馈,哪怕他们这次没被选中,也能通过“模拟演练”来进步。

3. 它怎么“看”世界?(从“看照片”到“读波形”)

以前的 AI 看图片,就像把一张照片切成无数个小方块(Token),然后一个个读。但这对于科学数据来说太粗糙了。

  • FoPE(傅里叶位置编码):科学数据(如光波、声波)是连续的波浪。Intern-S1-Pro 不再把数据切成方块,而是像**“听交响乐”一样,直接捕捉数据的频率和波形**。这让它能更精准地理解物理世界的连续变化。
  • 时间序列模块:对于心电图、地震波这种随时间变化的数据,它不再生硬地压缩,而是像**“智能剪辑师”**一样,根据信号的特点自动调整“剪辑”节奏,保留最重要的细节。

4. 它怎么“学”知识?(从“乱翻书”到“精读论文”)

科学文献里的图片(比如复杂的化学结构图)通常配文很少,甚至没有。

  • Caption 流水线:团队专门训练了一个**“超级翻译官”。它能把科学论文里那些晦涩难懂的图表,自动翻译成几千字的详细解说**(比如:“这张图展示了在 300 度高温下,A 物质如何分解成 B 物质……")。
  • 效果:这相当于给 AI 喂了**“带详细注释的教科书”**,而不是只有图片的画册,让它真正读懂了科学背后的逻辑。

5. 它有多强?(“通才”打败“专才”)

通常我们认为,做数学题要找数学专家,做生物题要找生物专家。

  • 反直觉的发现:Intern-S1-Pro 证明了,一个足够强大的“通才”,只要训练得当,比专门的“专才”更厉害
  • 战绩
    • 科学推理(SciReasoner)上,它的得分(55.5)是顶级商业模型(如 Gemini-3-Pro, GPT-5.2)的3-4 倍
    • 生物序列任务上,它甚至打败了专门针对生物训练的小模型。
    • 它不仅能做题,还能像科学家一样思考:看到数据 -> 提出假设 -> 设计实验 -> 得出结论。

总结

Intern-S1-Pro 就像是科学界的**“钢铁侠”**:

  1. 大脑够大(1 万亿参数);
  2. 团队协作好(分组路由,不内耗);
  3. 感官敏锐(能听懂波形,读懂复杂图表);
  4. 知识渊博(通过高质量数据“精读”了海量科学文献)。

它的出现意味着,AI 不再仅仅是个“聊天机器人”,而是真正成为了加速人类科学发现的超级助手。未来,它可能帮我们发现新药物、设计新材料,甚至预测气候变化。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →