MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data

이 논문은 결측 데이터를 보정하지 않고 가용 데이터만 처리하는 마스킹 자기 주의 메커니즘을 통해 불완전한 의료 데이터를 효과적으로 분석하는 새로운 트랜스포머 기반 모델인 MARIA 를 제안하고, 다양한 진단 및 예후 과제에서 기존 최첨단 모델보다 우수한 성능과 견고성을 입증했습니다.

Camillo Maria Caruso, Paolo Soda, Valerio Guarrasi

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 의료 현장에서 매우 흔한 문제인 **"데이터가 빠졌을 때 어떻게 진단을 내릴까?"**라는 질문에 대한 새로운 해법을 제시합니다.

제목은 MARIA (Multimodal Attention Resilient to Incomplete datA) 입니다. 쉽게 말해, **"불완전한 데이터를 잘 견디는 다재다능한 의료 AI"**라고 생각하시면 됩니다.

이 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 문제 상황: "손에 없는 정보로 요리하기"

의료진은 환자를 진단할 때 다양한 정보를 모읍니다. 혈액 검사, MRI 사진, 환자의 과거 병력, 생활 습관 등 여러 가지 (모달리티) 가 있습니다. 하지만 현실에서는 항상 모든 정보가 다 들어오지 않습니다.

  • 환자가 검사받으러 오지 않았거나 (모달리티 전체 누락),
  • 검사 기계가 고장 나서 일부 수치가 빠져있거나 (특정 데이터 누락),
  • 기록이 분실되거나 하는 경우가 많습니다.

기존의 AI 모델들은 이런 빠진 데이터를 만나면 당황합니다. 대부분은 **"가상 데이터 (Imputation)"**를 만들어서 빈칸을 채우는 방식을 썼습니다.

비유: 요리사가 레시피에 '소금'이 빠졌다고 해서, "아마도 소금이었을 거야"라고 추측해서 가짜 소금을 넣는 것과 같습니다. 이렇게 하면 요리의 맛이 원래 의도한 것과 달라질 수 있고, 오히려 독이 될 수도 있습니다.

2. MARIA 의 해법: "없는 건 무시하고, 있는 것만 집중하기"

MARIA 는 이 문제를 완전히 다른 방식으로 해결합니다. "가짜 소금"을 만들지 않습니다. 대신, **"있는 재료만 가지고 최고의 요리를 만드는 능력"**을 기릅니다.

  • 마스크된 주의 (Masked Attention): MARIA 는 마치 안개 낀 날에 운전하는 사람처럼 작동합니다. 앞이 안 보이는 부분 (빠진 데이터) 은 아예 무시하고, 안개 사이로 보이는 부분 (있는 데이터) 에만 집중해서 운전합니다.
  • 중간 융합 (Intermediate Fusion): 여러 가지 정보를 한 번에 섞는 것도, 각각 따로 요리해서 나중에 섞는 것도 아니라, 요리하는 중간 단계에서 서로 대화하게 합니다.
    • 비유: 여러 명의 요리사 (각각 다른 검사 데이터) 가 함께 일할 때, 한 명이 재료를 못 가져오면 그 사람은 "내가 못 가져왔으니 너네가 그 부분을 대신해 줘"라고 말하지 않고, **"나한테 있는 재료로 내가 할 수 있는 일을 하고, 너네가 가진 재료로 너네가 할 일을 해. 그리고 그 결과물을 합쳐서 최종 요리를 하자"**는 방식입니다.

3. 실험 결과: "데이터가 얼마나 없어도 이겨낸다"

연구진은 알츠하이머 진단, 코로나19 예후 예측 등 8 가지 의료 과제를 가지고 MARIA 를 기존 AI 10 개와 비교했습니다.

  • 결과: 데이터가 0% 에서 75% 까지 빠지는 극단적인 상황에서도 MARIA 가 다른 모델들보다 훨씬 좋은 성적을 냈습니다.
  • 특징: 데이터가 빠질수록 기존 모델들은 성능이 뚝 떨어졌지만, MARIA 는 **"데이터가 없어도 내가 할 수 있는 만큼 최선을 다한다"**는 태도로 오히려 더 강해졌습니다.

4. 왜 중요한가요?

의료 현장에서는 완벽한 데이터를 구하는 것이 거의 불가능합니다. 환자가 병원을 옮기거나, 검사를 거부하거나, 기록이 누락되는 건 일상입니다.

  • 기존 방식: "데이터가 부족하니 가짜로 채워서 추측하자" → 위험할 수 있음 (오진 가능성)
  • MARIA 방식: "데이터가 부족해도 있는 정보만 믿고 정확하게 판단하자" → 안전하고 신뢰할 수 있음

요약

MARIA는 **"빠진 데이터 때문에 포기하지 않고, 있는 정보만으로 최선의 판단을 내리는 똑똑한 의료 AI"**입니다. 마치 손에 재료가 부족해도 그날 가진 재료로 최고의 요리를 해내는 셰프처럼, 불완전한 현실에서도 환자를 정확하게 진단하고 미래를 예측할 수 있게 도와줍니다.

이 기술이 발전하면, 데이터가 부족한 지역이나 응급 상황에서도 AI 가 더 신뢰할 수 있는 의료 지원을 제공할 수 있게 될 것입니다.