MINT: Molecularly Informed Training with Spatial Transcriptomics Supervision for Pathology Foundation Models

이 논문은 공간 전사체학 데이터를 지도 신호로 활용하여 병리학 기초 모델의 형태학적 표현에 분자 상태를 효과적으로 통합하는 'MINT' 프레임워크를 제안하고, 이를 통해 유전자 발현 예측 및 일반 병리학 작업에서 기존 모델보다 우수한 성능을 입증했습니다.

Minsoo Lee, Jonghyun Kim, Juseung Yun, Sunwoo Yu, Jongseong Jang

게시일 2026-03-10
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"병리 조직 이미지를 보는 AI 가, 그 조직의 '분자적 숨결'까지 읽을 수 있게 된 방법"**에 대한 이야기입니다.

기존의 AI 는 거대한 병리 슬라이드 이미지를 보고 세포 모양을 익혔지만, 그 세포 안에서 어떤 유전자가 작동하고 있는지 (분자 상태) 는 알지 못했습니다. 이 논문은 MINT라는 새로운 기술을 제안하며, 이 두 가지 정보를 자연스럽게 결합하는 방법을 소개합니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


🏥 비유: "건축가"와 "전기 배선도"

1. 기존 AI (기존 병리 모델) = 뛰어난 '건축가'
기존에 훈련된 AI 는 거대한 병리 슬라이드 이미지를 수백만 장이나 보며 **'건축가'**가 되었습니다.

  • 무엇을 잘하나요? 벽돌 (세포) 이 어떻게 쌓였는지, 건물의 구조 (조직 형태) 가 어떤지 아주 잘 봅니다.
  • 한계는? 건물의 겉모습은 완벽하게 이해하지만, 건물 내부의 **'전기 배선도 (유전자 발현)'**나 '어떤 방에 어떤 전구가 켜져 있는지'는 모릅니다. 하지만 실제로는 배선 상태가 건물의 기능 (질병의 종류나 진행 정도) 을 결정합니다.

2. 새로운 기술 (공간 전사체학, ST) = '전기 배선도'
최근 기술 발전으로 우리는 조직의 특정 위치에서 **어떤 유전자가 켜져 있는지 (분자 정보)**를 직접 측정할 수 있게 되었습니다. 이는 마치 건물의 각 방마다 설치된 전기 배선도를 보는 것과 같습니다.

3. MINT 의 등장: "건축가에게 배선도 읽는 법을 가르치되, 건축 실력은 잊지 않게"
연구진은 이 두 가지 정보를 합치려고 했지만, 큰 문제가 있었습니다.

  • 문제점: 건축가 (기존 AI) 에게 갑자기 배선도 (분자 정보) 를 가르치려 하면, 기존에 쌓아온 건축 실력 (형태학적 지식) 을 잊어버리는 '망각' 현상이 일어날 수 있습니다. (예: "아, 배선도만 중요하구나"라고 생각해서 벽돌 쌓는 법을 잊어버림)

MINT 는 이 문제를 세 가지 똑똑한 방법으로 해결합니다.

🧩 해결책 1: "별도의 메모장" (ST 토큰)

기존 AI 가 이미지를 볼 때, **새로운 '분자 정보용 메모장 (ST 토큰)'**을 하나 더 챙겨줍니다.

  • 기존 메모장 (CLS 토큰): 여전히 "이건 암세포 모양이야", "염증이 있네" 같은 형태 정보만 적습니다.
  • 새 메모장 (ST 토큰): "이곳의 유전자는 A 가 켜져 있고, B 는 꺼져 있어" 같은 분자 정보만 적습니다.
  • 효과: 두 가지 정보가 서로 섞여서 기존 지식을 지우는 일을 방지합니다. 마치 건축가가 배선도를 볼 때, 원래의 건축 실력을 유지한 채 새로운 정보를 추가하는 것과 같습니다.

🛡️ 해결책 2: "이중 안전장치" (학습과 고정)

AI 가 새로운 것을 배울 때, 원래의 실력이 떨어지지 않도록 두 가지 장치를 켭니다.

  1. 스스로 가르치기 (DINO): AI 가 이미지를 다시 보고 스스로 "내가 본 건물이 원래 모양과 비슷해"라고 확인하며 실력을 유지합니다.
  2. 원본 고정 (Feature Anchoring): AI 가 배운 내용을 원래의 ' frozen(얼어붙은)' 모델과 비교합니다. "너가 배운 게 원래 실력과 너무 달라지면 안 돼!"라고 경고하며, 형태학적 지식을 잊지 못하게 묶어둡니다.

📏 해결책 3: "거시적 & 미시적" 두 가지 시선

  • Visium (점 단위): 조직 전체를 큰 점으로 보며 "이 구역 전체의 유전자 상태"를 학습합니다.
  • Xenium (세포 단위): 아주 작은 세포 하나하나의 유전자 상태까지 세밀하게 학습합니다.
  • 효과: 넓은 시야와 좁은 시야를 모두 활용하여 AI 가 조직을 더 입체적으로 이해하게 합니다.

🏆 결과: "두 마리 토끼를 다 잡았다"

이 MINT 기술을 적용한 결과는 놀라웠습니다.

  1. 유전자 예측 능력 (HEST-Bench): 건축가에게 배선도 읽는 법을 가르쳤더니, 유전자 상태를 예측하는 능력이 기존 모델들보다 훨씬 뛰어났습니다. (평균 정확도 0.440, 1 위)
  2. 일반 병리 능력 (EVA): 중요한 점은, 유전자를 배우는 과정에서 기존에 잘하던 '형태 분석 능력'이 떨어지지 않았다는 것입니다. 오히려 대부분의 병리 진단 작업에서도 1 위를 차지했습니다.

💡 결론: 왜 이것이 중요한가요?

기존에는 AI 를 더 똑똑하게 만들려면 더 많은 이미지를 보여줘야 했습니다 (데이터 양 늘리기).
하지만 이 논문은 **"이미지뿐만 아니라, 그 안에 숨겨진 분자 정보 (유전자) 를 함께 가르쳐주면 AI 가 훨씬 더 똑똑해진다"**는 것을 증명했습니다.

한 줄 요약:

"기존의 뛰어난 '건축가 AI'에게 '전기 배선도'를 보여주되, 건축 실력을 잃지 않게 보호해 주는 새로운 학습법 (MINT) 을 개발하여, 병리 진단과 유전자 분석 모두에서 최고의 성능을 냈다."

이 기술은 앞으로 AI 가 질병을 단순히 '모양'으로만 보는 것이 아니라, 그 이면의 '분자적 원인'까지 이해하는 차세대 의료 AI 의 기초가 될 것입니다.