Inference-Time Dynamic Modality Selection for Incomplete Multimodal Classification

이 논문은 결측 멀티모달 데이터의 분류 성능을 극대화하기 위해 추론 시 작업 관련 정보를 최대화하는 동적 모달리티 선택 프레임워크 'DyMo'를 제안하며, 기존 폐기 또는 보간 방식의 한계를 극복하고 다양한 데이터셋에서 최첨단 성능을 입증했습니다.

Siyi Du, Xinzhe Luo, Declan P. O'Regan, Chen Qin

게시일 2026-02-24
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧩 잃어버린 조각을 찾아내는 똑똑한 AI: 'DyMo' 이야기

이 논문은 **"불완전한 정보로 세상을 이해하는 AI"**에 대한 이야기입니다. 우리가 살아가면서 모든 정보가 완벽하게 주어지는 경우는 드뭅니다. 예를 들어, 의사가 환자를 진료할 때 MRI 사진은 있는데 혈액 검사 결과는 없거나, 반대로 혈액 검사만 있고 영상은 없는 경우가 있죠.

기존의 AI들은 이런 상황에서 두 가지 선택지 중 하나만 고려했습니다.

  1. 무시하기: 정보가 없는 건 그냥 무시하고 나머지 정보만으로 판단한다. (하지만 중요한 정보가 빠질 수 있어 위험함)
  2. 추측하기: 없는 정보를 AI 가 임의로 만들어서 (추정해서) 채운다. (하지만 잘못된 추측을 하면 오히려 혼란을 줌)

이 논문은 이 두 가지의 단점을 모두 해결한 새로운 방법, **'DyMo'**를 제안합니다.


🍽️ 비유로 이해하는 DyMo 의 원리

이해를 돕기 위해 **'요리사'**와 **'손님'**의 상황을 상상해 보세요.

1. 상황: 손님이 주문을 하려는데 재료가 부족해요

손님이 "스테이크를 주세요"라고 주문했는데, 주방에는 **고기 (이미지)**만 있고 **소스 (텍스트/데이터)**가 없습니다.

  • 기존 방법 A (무시하기): 소스가 없으니 고기만 보고 "아마도 소금 간을 했겠지?"라고 추측해서 내줍니다. (맛이 없을 수도 있음)
  • 기존 방법 B (임의 추측): 소스 레시피를 기억하지 못하더라도, AI 가 "어디서 본 것 같은 소스"를 임의로 만들어서 고기에 붓습니다. (하지만 그 소스가 고기와 안 맞거나, 상한 소스일 수도 있음)

2. DyMo 의 새로운 방법: "맛있는 소스만 골라 넣기"

DyMo 는 이렇게 생각합니다.

"소스 (빠진 정보) 가 없다면, AI 가 임시로 소스를 만들어 보자. 그런데 이 만든 소스가 진짜 맛있는지, 아니면 상한 소스인지 미리 맛을 보고 결정하자!"

DyMo 는 다음과 같은 3 단계로 작동합니다.

① 임시 소스 만들기 (회복)
빠진 정보를 AI 가 먼저 추측해서 '임시 소스'를 만들어냅니다.

② 맛보기 테스트 (동적 선택)
이제 이 '임시 소스'를 진짜 고기에 섞어볼까요?

  • 맛이 좋아졌다면? 👉 "좋아! 이 소스는 진짜 정보를 담고 있구나!"라고 생각해서 실제 메뉴판에 포함시킵니다.
  • 맛이 이상하거나 상했다면? 👉 "아, 이 소스는 엉터리구나. 넣으면 안 되겠다."라고 생각해서 버립니다.

③ 최종 결정
오직 **맛있는 정보 (신뢰할 수 있는 복구된 데이터)**만 골라내서 최종적인 판단을 내립니다.


🚀 왜 이것이 중요한가요? (핵심 기술)

이 논문에서 가장 혁신적인 점은 **"어떻게 맛을 보는가?"**입니다.

  • 기존의 문제: 다른 AI 들은 "이 소스가 얼마나 그럴듯해 보이느냐 (모양)"만 보고 판단했습니다. 그래서 모양은 예쁜데 맛없는 (의미가 없는) 소스를 넣는 실수를 자주 했습니다.
  • DyMo 의 해법: DyMo 는 **"이 소스를 넣었을 때, 정답을 맞출 확률이 얼마나 올라가는가?"**를 계산합니다.
    • 마치 요리사가 "이 소스를 넣으면 손님이 만족할까?"를 계산하는 것처럼, AI 는 **"이 정보를 추가하면 내 점수 (오류율) 가 줄어드는가?"**를 실시간으로 계산합니다.
    • 점수가 올라가면 (오류가 줄어들면) 그 정보를 받아들이고, 점수가 떨어지면 (오류가 늘면) 그 정보를 거절합니다.

이 과정을 매번 (실시간) 수행하기 때문에, 어떤 정보는 받아들이고 어떤 정보는 거절할지 상황에 따라 유동적으로 결정할 수 있습니다.


🏆 실제 성과: 의료와 일상에서 빛을 발하다

이 방법은 실제 실험에서 놀라운 결과를 보여주었습니다.

  1. 의료 진단 (심장병): MRI 영상과 환자의 병력 데이터 중 일부가 누락되어도, DyMo 는 누락된 데이터를 '맛있게' 복구해서 진단 정확도를 높였습니다. 잘못된 추측을 하지 않기 때문에 오진 위험을 줄여줍니다.
  2. 이미지 인식: 손글씨 숫자나 얼굴 사진을 인식할 때, 일부 정보가 없어도 다른 정보와 잘 어울리는 '추측 정보'만 골라내어 정확도를 높였습니다.

💡 한 줄 요약

**"정보를 잃어버렸을 때, 무조건 무시하거나 막연히 추측하지 말고, AI 가 '이 정보가 진짜 도움이 될까?'를 실시간으로 테스트해서, 도움이 되는 정보만 골라내어 최선의 결정을 내리는 똑똑한 시스템"**입니다.

이처럼 DyMo는 불완전한 세상에서 AI 가 더 안전하고 정확하게 일할 수 있도록 도와주는 '현명한 필터' 역할을 합니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →