WSI-INR: Implicit Neural Representations for Lesion Segmentation in Whole-Slide Images

本文提出了基于隐式神经表示(INR)的 WSI-INR 框架,通过构建从空间坐标直接映射到组织语义的连续函数并引入多分辨率哈希网格编码,有效解决了传统补丁法破坏空间连续性的问题,实现了在保持跨分辨率鲁棒性的同时显著提升了对高度异质性病理病灶的分割性能。

Yunheng Wu, Wenqi Huang, Liangyi Wang, Masahiro Oda, Yuichiro Hayashi, Daniel Rueckert, Kensaku Mori

发布于 2026-03-05
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 WSI-INR 的新方法,用来解决医学病理图像分析中的一个大难题。为了让你轻松理解,我们可以把整个过程想象成**“绘制一幅巨大的、细节丰富的世界地图”**。

1. 背景:我们要看什么?(全切片图像 WSI)

想象一下,病理科医生需要检查一块人体组织(比如淋巴结),看看有没有癌细胞。

  • 传统做法:医生把这块组织放在显微镜下,从低倍镜(看整体)到高倍镜(看细胞细节)反复观察。
  • 数字化后:现在的技术可以把整块组织扫描成一张超级巨大的数字图片,叫做全切片图像(WSI)。这张图大得惊人,如果把它打印出来,可能比足球场还大,而且里面包含了从宏观组织到微观细胞的无数细节。

2. 旧方法的麻烦:拼图游戏(Patch-based Methods)

以前的电脑程序处理这种“超级大图”时,就像是在玩拼图

  • 切块:因为电脑内存有限,它无法一次性把整张“足球场”大小的图装进脑子。所以,它把大图切成成千上万个小的正方形碎片(Patch)。
  • 断章取义:程序分别分析每一块碎片,告诉它:“这块是癌,那块是好的”。
  • 拼回去:最后再把所有碎片的分析结果拼回去。

这就带来了两个大问题:

  1. 连续性断了:就像拼图边缘,癌细胞可能正好跨在两块碎片的交界处。旧方法容易把连续的病变切得支离破碎,导致结果看起来像“马赛克”,不够连贯。
  2. 变焦就懵圈:医生看片子时,会切换显微镜的倍数(从低倍到高倍)。旧方法把不同倍数的图当成完全不同的东西来学。如果它在“低倍镜”下训练,到了“高倍镜”下,它可能就认不出同样的组织了,因为它是把“同一块肉”在不同距离看的样子,当成了“两块不同的肉”来学。

3. 新方案:WSI-INR(隐式神经表示)

这篇论文提出的 WSI-INR 方法,不再玩拼图,而是换了一种思路:把整张图想象成一首连续的“旋律”或一个“函数”

核心比喻:GPS 导航系统

想象你有一个超级智能的GPS 导航系统,它不需要把地图切成一块一块的,而是记住了一条连续的规则

  • 输入:你告诉它一个坐标(比如:经度 120.5,纬度 30.2)。
  • 输出:它直接告诉你这个坐标上是什么(是“癌组织”还是“正常组织”),甚至能告诉你这里长什么样。

WSI-INR 就是这么工作的:
它不切图,而是学习一个**“从坐标到组织特征”的连续函数**。

  • 你问它任何位置的坐标,它都能立刻回答。
  • 因为它学的是“规则”而不是“碎片”,所以无论你怎么放大、缩小(改变分辨率),它都能理解这是同一块组织在不同密度下的采样,就像你走近看地图和退后看地图,看到的都是同一张地图,只是细节密度不同。

4. 它的三大绝招

  1. 多分辨率哈希编码(像不同密度的采样网)

    • 比喻:想象你在用不同网眼的渔网捕鱼。
      • 低倍镜 = 大网眼,能抓到鱼群的整体分布(大结构)。
      • 高倍镜 = 小网眼,能抓到具体的鱼(细胞细节)。
    • WSI-INR 的做法:它用一种特殊的“哈希网格”,把不同倍数的图看作是同一张渔网在不同密度下的采样。它不需要重新学习,只需要调整采样的密度,就能在不同分辨率下保持对组织的理解一致。这解决了旧方法“变焦就懵”的问题。
  2. 两步走训练策略(先认脸,再找病)

    • 第一步(重建):先让模型学会“看图说话”。给它坐标,让它把原本的图片颜色还原出来。这就像让画家先学会如何精准地描绘皮肤纹理和颜色,建立对组织的“直觉”。
    • 第二步(分割):在有了这种“直觉”的基础上,再教它哪里是癌,哪里是好的。
    • 为什么这么做?:如果一开始就只教它找癌,它可能会走捷径(比如只记住某些颜色差异),而忽略了真正的组织结构。先学会“重建”能确保它真正理解了组织的结构。
  3. 推理时的微调(临场发挥)

    • 当遇到一张全新的、没见过的病人切片时,WSI-INR 会先花一点点时间,专门针对这张图进行“热身”(推理时优化)。
    • 比喻:就像一位经验丰富的老中医,面对新病人时,会先仔细把脉、观察气色(重建),调整一下自己的判断标准,然后再下诊断(分割)。这让它在面对不同医院、不同扫描设备产生的图像时,依然非常稳健。

5. 结果怎么样?

实验结果显示,WSI-INR 表现非常出色:

  • 抗干扰能力强:当分辨率发生变化(比如从训练时的清晰度变成模糊版)时,传统的“拼图法”(如 U-Net)准确率会暴跌(甚至下降 50% 以上),而 WSI-INR 依然能保持稳定的判断。
  • 连续性好:它画出的病变区域是连贯的,不会出现断断续续的“马赛克”现象。
  • 突破局限:以前这种“隐式神经表示”技术只擅长处理结构规则的东西(比如心脏、大脑),但这篇论文证明,它也能处理杂乱无章、千变万化的癌细胞组织,这是一个巨大的突破。

总结

简单来说,WSI-INR 就是把病理图像分析从**“切碎了拼凑”升级到了“整体理解”。它像一位拥有透视眼**的医生,无论你把显微镜拉近还是推远,它都能清晰地看到组织的连续结构,精准地找出病变,不会因为视角的切换而迷失方向。这为未来的自动化病理诊断提供了一种更聪明、更稳健的新思路。