CARE: A Molecular-Guided Foundation Model with Adaptive Region Modeling for Whole Slide Image Analysis

Each language version is independently generated for its own context, not a direct translation.

기존의 인공지능 모델들은 거대한 병리 슬라이드를 분석할 때, 마치 거대한 퍼즐을 무작위로 잘게 자른 조각들을 하나씩 보는 것과 비슷했습니다.

기존 방식 (Patch 기반): 슬라이드를 정사각형 격자로 잘게 쪼개서 (예: 1cm x 1cm) 각각을 분석합니다.
- 문제점: 이는 마치 벽돌 하나하나만 보고 건물의 전체 구조를 이해하려는 것과 같습니다. 벽돌 하나만 보면 "이게 벽돌이구나"는 알 수 있어도, "이건 창문이다", "이건 기둥이다"라는 의미 있는 연결을 놓치기 쉽습니다. 또한, 병리학자가 실제로 진단할 때는 특정 부위 (종양 등) 를 집중해서 보는데, AI 는 모든 조각을 똑같이 중요하게 여기느라 핵심을 놓치는 경우가 많았습니다.

CARE 는 이 문제를 해결하기 위해 **적응형 지역 모델링 (Adaptive Region Modeling)**이라는 기술을 도입했습니다.

비유: "단어"로 읽기 vs "문장"으로 읽기
- 기존 모델은 글자를 하나하나 (Patch) 읽는다면, CARE 는 의미 있는 '단어'나 '구' (Adaptive Region) 단위로 묶어서 읽습니다.
- 예를 들어, "사과", "배", "포도" 같은 과일들이 모여 있다면, CARE 는 이를 따로따로 보지 않고 **"과일 바구니"**라는 하나의 의미 있는 덩어리로 인식합니다.
- 핵심: CARE 는 조직의 모양과 구조를 보고, **자연스럽게 뭉쳐진 부분 (예: 종양 덩어리, 정상 조직)**을 스스로 찾아내어 그 영역을 하나의 단위로 처리합니다.

CARE 는 단순히 이미지만 보고 배우지 않습니다. 분자 (유전자, 단백질) 정보라는 '비밀 지도'를 함께 사용합니다.

1 단계: 스스로 배우기 (Self-Supervised)
- 먼저 3 만 4 천 장 이상의 슬라이드를 보며 조직의 모양 (형태) 을 익힙니다. 아직 정답을 알려주지 않아도 스스로 패턴을 찾아냅니다.
2 단계: 분자 지도로 다듬기 (Molecular Guidance)
- 여기서가 진짜 핵심입니다. CARE 는 RNA(유전자) 와 단백질 정보를 함께 공부합니다.
- 비유: 마치 수술실 의사가 환자의 혈액 검사 결과 (분자 정보) 를 보며, 현미경으로 어떤 부위가 가장 위험한지 정확히 짚어내는 것과 같습니다.
- 이 과정을 통해 CARE 는 "아, 이 모양의 조직은 유전자적으로 이런 특징을 가진구나!"라고 연결하며, **진짜 중요한 부분 (ROI)**을 더 정확하게 찾아내게 됩니다.

적은 데이터로 큰 성과: 보통 AI 모델은 엄청난 양의 데이터를 먹어야 잘합니다. 하지만 CARE 는 다른 모델들이 사용하는 데이터의 10 분의 1 정도만으로도 더 좋은 결과를 냈습니다. (분자 정보를 활용해 효율적으로 학습했기 때문입니다.)
다양한 임무 수행:
- 질병 분류: "이게 암인가요, 암이 아닌가요?"
- 유전자 예측: "이 조직에서 어떤 유전자 변이가 일어났을까요?" (이 부분에서 CARE 가 특히 뛰어납니다.)
- 예후 분석: "환자의 생존 기간은 얼마나 될까요?"
해석 가능성: CARE 는 "어떤 부분을 보고 이렇게 판단했는지"를 보여줍니다. 병리학자가 눈으로 확인한 위험 부위와 AI 가 주목한 부위가 거의 일치합니다.

기존 AI 가 거대한 슬라이드를 무작위로 잘게 쪼개서 분석했다면, CARE 는 조직의 자연스러운 흐름을 따라 의미 있는 덩어리로 묶어 분석합니다.

마치 현명한 탐정이 사건 현장 (슬라이드) 을 볼 때, 모든 것을 무작위로 조사하는 대신 중요한 단서 (분자 정보) 를 바탕으로 핵심 증거 (적응형 영역) 에 집중하여 사건을 해결하는 것과 같습니다.

이 기술은 앞으로 병리학자들이 더 빠르고 정확하게 진단을 내리는 데 큰 도움을 줄 것으로 기대됩니다.

유사한 논문