MINT: Molecularly Informed Training with Spatial Transcriptomics Supervision for Pathology Foundation Models

本文提出了 MINT 框架,通过将空间转录组监督信号融入预训练病理基础模型,在避免灾难性遗忘的同时实现了基因表达预测与通用病理任务性能的显著提升。

Minsoo Lee, Jonghyun Kim, Juseung Yun, Sunwoo Yu, Jongseong Jang

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 MINT 的新方法,它就像给病理学 AI 模型装上了一副“分子透视眼镜”,让原本只能看“长相”的 AI,现在能同时读懂细胞内部的“基因密码”。

为了让你更容易理解,我们可以用几个生活中的比喻来拆解这项技术:

1. 背景:AI 医生目前的“视力”局限

想象一下,现在的顶级病理 AI(我们叫它“老医生”)是通过看数百万张显微镜下的组织切片照片来学习的。

  • 它擅长什么? 它非常擅长看细胞的**“长相”**(形态学)。比如,它能一眼看出细胞排列是否整齐、形状是否怪异,从而判断是不是癌症。这就像一位经验丰富的老中医,看气色、看面相就能诊断。
  • 它缺什么? 它看不到细胞内部的**“基因活动”**(分子状态)。比如,细胞里哪些基因在疯狂工作,哪些信号通路在报警。这就像老中医虽然知道病人脸色不好,但不知道具体是哪个器官的生化指标出了问题。

2. 新工具:空间转录组学(ST)

现在,科学家发明了一种新技术叫“空间转录组学”。它不仅能拍照,还能在拍照的同一个位置,直接测量细胞里的基因表达情况。

  • 比喻: 这就像给老医生配了一台“基因检测仪”。以前他只能看照片,现在他能在看照片的同时,直接听到细胞内部的“基因广播”。

3. 核心挑战:如何教 AI 既学新技能,又不忘老本行?

如果把“基因广播”直接教给“老医生”,会出现一个严重问题:“灾难性遗忘”

  • 比喻: 就像你让一个擅长下棋的大师突然去学弹钢琴。如果训练方法不对,他可能会为了练琴,把下棋的招数全忘了。在 AI 里,如果强行让模型去预测基因,它可能会把之前学到的“看长相”的宝贵经验覆盖掉,导致它既不会看基因,也不会看病理图了。

4. MINT 的解决方案:给 AI 装上“双通道”

MINT(分子知情训练)巧妙地解决了这个问题,它做了三件聪明事:

A. 设立“专属座位”(ST Token)

以前的 AI 只有一个“大脑核心”(CLS token),负责处理所有信息。MINT 给 AI 加了一个**“专属座位”**(ST token)。

  • 比喻: 想象一个会议室。
    • 老座位(CLS): 专门负责看照片、记长相。
    • 新座位(ST): 专门负责听基因广播、记分子数据。
    • 好处: 两个座位互不干扰。老座位继续专心看照片,新座位专心学基因。这样 AI 既学会了新技能,又完全没丢掉老本行。

B. 双重“防遗忘”机制

为了防止 AI 在学基因时把看照片的本事弄丢了,MINT 用了两个“锚点”:

  1. 自我模仿(DINO): 让 AI 看着自己的“影子”(之前的版本)学习,保持视觉习惯。
  2. 冻结老师(Feature Anchoring): 把原来的“老医生”模型冻结住,作为一个标准答案,时刻提醒新模型:“看照片的方式要像老师一样,不能变!”
  • 比喻: 就像学骑自行车,你一边看教练(冻结模型)怎么骑,一边看着自己的影子(自我模仿),确保你学新技巧(基因)的时候,骑车姿势(看病理图)不会变形。

C. 多尺度“听课”

MINT 不仅听大范围的基因信号(像听整个房间的广播),也听微观的、单个细胞的信号(像听隔壁邻居的悄悄话)。

  • 比喻: 它既看宏观的“街区地图”,也看微观的“单户人家”,让理解更全面。

5. 结果:1+1 > 2

经过这种训练,MINT 模型取得了惊人的成绩:

  • 在基因预测上: 它比所有现有的模型都准(就像新医生能更精准地开出基因层面的药方)。
  • 在看病图上: 它完全没有退步,甚至在很多任务上变得更强了(老本行不仅没丢,还因为有了基因知识的辅助,看得更透了)。

总结

这篇论文的核心思想就是:不要试图把 AI 变成一个“全能超人”去硬扛所有任务,而是给它分派不同的“岗位”

MINT 通过给 AI 增加一个专门处理基因信息的“新大脑”,同时用特殊的方法保护它原有的“视觉大脑”,成功实现了**“既懂长相,又懂基因”**。这证明了,未来的医疗 AI 不再仅仅依赖“看图片”,结合“分子数据”将是提升诊断水平的关键新方向。