H2O: A Foundation Model Bridging Histopathology to Spatial Multi-Omics Profiling

本文提出了 H2O 这一通用人工智能框架,通过结合视觉 Transformer 与大语言模型,实现了从常规 H&E 组织病理图像直接推断空间转录组和蛋白质组图谱,从而以低成本、高可扩展性的方式桥接了组织形态学与分子多组学之间的鸿沟。

原作者: Gu, Y., Wu, Z., Yan, R., Wang, Z., Li, Y., Lin, S., Cui, Y., Lai, H., Luo, X., Zhou, S. K., Yuan, Z., Yao, J.

发布于 2026-04-24
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

想象一下,你手里拿着一张普通的黑白老照片(这就是病理医生每天看的 H&E 染色切片),照片里只能看到建筑物的轮廓和阴影,却完全看不到里面住的人、他们在做什么、或者他们手里拿着什么文件。

传统的做法是,如果你想了解照片里“居民”的详细信息(比如他们的基因表达、蛋白质活动),你就得花钱、花时间去给这栋建筑做一次昂贵的全身 CT 扫描和 DNA 测序(这就是空间多组学检测)。但这不仅贵得离谱,而且速度很慢,很难大规模推广。

这篇论文介绍了一个叫 H2O 的超级 AI 助手,它就像一位拥有“透视眼”的神探

H2O 是怎么工作的?

  1. 它是个“翻译官”
    H2O 把两种完全不同的语言强行“联姻”了。一边是视觉语言(看照片里的细胞长什么样、排列多整齐),另一边是分子语言(细胞里到底在表达什么基因、有什么蛋白质)。它利用一种叫“对比学习”的魔法,教会 AI 明白:“哦,原来这种细胞排列的形状,就代表着某种特定的基因正在活跃。”

  2. 它是个“超级预言家”
    以前,AI 看照片只能猜个大概。但 H2O 是在130 万张来自 25 种不同器官和癌症的“照片 + 真实分子数据”配对图上训练出来的。这就像让一个学生读了 130 万本“看图说话”的教科书,现在只要给它一张普通的黑白病理照片,它就能直接“脑补”出这张照片里原本看不见的基因和蛋白质分布图。

  3. 它甚至能“读心”
    最神奇的是,H2O 不仅能看到细胞里有什么,还能看出细胞之间在“聊什么”。比如,它能直接从照片里推断出细胞 A 正在通过某种信号(MIF-CD74/CD44 轴)给细胞 B 发指令。这就像看着两个陌生人站在一起,AI 就能告诉你他们正在商量什么秘密,完全不需要真的去窃听他们的对话(不需要做分子检测)。

为什么这很厉害?

  • 变废为宝:医院里堆积如山的普通病理切片(H&E),以前只能用来诊断“是不是癌症”,现在在 H2O 眼里,它们变成了藏宝图
  • 省钱又高效:你不需要再给每个病人做昂贵的分子检测,只要有一张普通的病理照片,AI 就能帮你生成一份详细的“分子地图”。
  • 万能通用:不管是在发育中的胎儿、复杂的淋巴结,还是各种癌症,H2O 都能准确工作,就像一把万能钥匙,能打开各种组织奥秘的大门。

总结一下

简单来说,H2O 就是把普通的病理照片变成了“分子显微镜”。它让医生不再需要昂贵的设备就能“看”到细胞内部的分子世界,把原本昂贵、缓慢的分子检测,变成了像看照片一样简单、快速且便宜的事情。这就像是给传统的病理学装上了一个数字化的“透视眼镜”,让我们能以前所未有的清晰度去理解生命的奥秘。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →