Evolving Medical Imaging Agents via Experience-driven Self-skill Discovery

이 논문은 검증된 실행 궤적을 기반으로 재사용 가능한 복합 도구를 자동으로 발견하고 학습하여 정적 도구 구성의 한계를 극복하고 다양한 의료 영상 작업에서 적응형 성능을 향상시키는 자기 진화형 의료 에이전트 'MACRO'를 제안합니다.

Lin Fan, Pengyu Dai, Zhipeng Deng, Haolin Wang, Xun Gong, Yefeng Zheng, Yafei Ou

게시일 2026-03-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🍳 비유: "고정된 레시피" vs "스스로 레시피를 만드는 요리사"

1. 기존 의료 AI 의 문제점: "고정된 레시피"

지금까지의 의료 AI 는 마치 오직 '김치찌개' 레시피만 외운 요리사와 같습니다.

  • 상황: 환자가 들어오면 AI 는 미리 정해진 도구들 (이미지 분석, 측정 등) 을 순서대로 사용합니다.
  • 문제: 만약 환자가 김치찌개가 아니라 '새로운 종류의 국물 요리'를 요구하거나, 재료가 조금 달랐다면? 이 요리사는 당황해서 실패합니다. 기존에 정해진 레시피 (도구 조합) 밖으로는 생각할 수 없기 때문입니다. 병원마다 장비가 다르고, 새로운 질병이 나타나면 이 AI 는 다시 처음부터 레시피를 만들어야 하는 수고를 겪습니다.

2. MACRO 의 혁신: "경험을 통해 레시피를 창조하는 요리사"

MACRO 는 실제 진료를 반복하며 스스로 '새로운 레시피'를 만들어내는 요리사입니다.

  • 스스로 배우기: MACRO 는 수많은 환자를 진료하면서, "아, 이 경우에는 A 도구로 시작해서 B 도구로 끝내는 게 가장 잘되네?"라고 깨닫습니다.
  • 새로운 도구 만들기: 이 성공적인 과정 (A → B) 을 하나의 **'새로운 복합 도구 (Composite Tool)'**로 만들어냅니다. 마치 "김치찌개 끓이기"라는 하나의 큰 버튼이 생기는 것과 같습니다.
  • 성장: 시간이 지날수록 이 AI 는 수백 가지의 새로운 '복합 도구'를 갖게 되고, 어떤 복잡한 환자라도 이 새로운 도구들을 조합해서 빠르게, 정확하게 진단할 수 있게 됩니다.

🚀 MACRO 가 어떻게 작동할까요? (3 단계 과정)

이 과정은 크게 세 가지 단계로 나뉩니다.

1 단계: "기억상자" (Experience Memory)

  • 비유: 요리사가 맛있는 요리를 성공했을 때 그 과정을 사진첩에 남기는 것입니다.
  • 작동: MACRO 는 환자를 진료할 때, 비슷한 증상의 과거 사례들을 '기억상자'에서 찾아봅니다. "이전에도 이런 눈 (안과) 사진을 볼 때, 이렇게 처리했더니 성공했었지?"라고 참고합니다.

2 단계: "레시피 발견" (Self-skill Discovery)

  • 비유: 요리사가 자주 쓰는 동작들을 묶어서 '스무디 만들기'라는 하나의 기술로 만드는 것입니다.
  • 작동: MACRO 는 수많은 진료 과정을 분석합니다. "어? '사진 자르기' → '색깔 바꾸기' → '병변 찾기'라는 순서가 자주 성공했네?"라고 발견하면, 이 세 단계를 하나로 합쳐 **'병변 찾기 (새로운 도구)'**라는 이름으로 저장합니다. 이제 AI 는 이 복잡한 과정을 한 번에 수행할 수 있게 됩니다.

3 단계: "수련과 강화" (GRPO Training)

  • 비유: 요리사가 새로 만든 레시피를 써먹어보고, 성공하면 칭찬을 받아 더 잘하게 되는 것입니다.
  • 작동: AI 는 새로 만든 '복합 도구'를 사용해 봅니다. 만약 이 도구를 써서 환자를 정확히 진단하면, AI 는 "와, 이 방법이 좋구나!"라고 보상 (기쁨) 을 받습니다. 반대로 실패하면 다시 배우게 됩니다. 이 과정을 반복하며 AI 는 점점 더 똑똑해집니다.

💡 왜 이것이 중요한가요?

  1. 유연성 (Adaptability): 병원마다 사용하는 장비나 진료 방식이 다릅니다. MACRO 는 새로운 환경에 맞춰 스스로 도구를 발전시킬 수 있어, 어디에서도 잘 작동합니다.
  2. 정확도 (Accuracy): 실험 결과, MACRO 는 기존 최고의 의료 AI 들보다 녹내장 (눈병) 이나 심장병 진단에서 훨씬 높은 정확도를 보였습니다. 특히 복잡한 단계를 거치는 진단에서 강점을 발휘했습니다.
  3. 지속 가능한 발전: 기존 AI 는 개발자가 수동으로 레시피를 고쳐줘야 했지만, MACRO 는 진료 현장의 경험을 통해 스스로 진화합니다.

📝 한 줄 요약

"MACRO 는 진료 현장에서 실패와 성공을 반복하며, 스스로 '새로운 진단 기술'을 만들어내고 발전시켜 나가는, 살아있는 의료 AI 입니다."

이 기술이 보편화되면, 의사는 AI 가 새로운 질병이나 변화된 상황에 맞춰 스스로 적응해 주는 것을 보고, 더 정확한 진단을 받을 수 있게 될 것입니다.