A Bibliometric Review of Explainable AI in Diabetes Risk Prediction: Trends,… — 쉬운 설명

당뇨병은 전 세계적으로 매우 큰 문제입니다. 이제 우리는 **AI(기계 학습)**를 이용해 "이 사람이 당뇨병에 걸릴 확률이 얼마나 될까?"를 아주 정확하게 예측할 수 있게 되었습니다.

하지만 여기서 문제가 생깁니다. AI 는 마치 신비로운 마법 요리사처럼 작동합니다.

의사들은 환자에게 "왜 위험한지" 설명해 주어야 합니다. "체중이 너무 많아서요", "혈당이 높아서요" 같은 이유를 말해줘야 환자가 믿고 치료받기 때문입니다. 그래서 **AI 가 자신의 '생각 과정'을 설명해 주는 기술 (XAI)**이 등장했습니다.

저자는 전 세계 논문 2,048 편을 분석해서 이 분야의 현황을 파악했습니다. 마치 레스토랑 리뷰를 모아서 분석하는 것처럼요.

현재 상황: AI 가 예측한 결과에 대해 "어떤 재료 (혈당, 체중 등) 가 가장 큰 영향을 줬는지" 설명하는 기술 (SHAP, LIME 같은 것들) 은 매우 활발하게 연구되고 있습니다.
발견된 큰 구멍 (Gap): 하지만 "왜 그 재료가 위험한지"에 대한 의학적인 연결고리를 설명하는 기술은 거의 없습니다.
- 비유: AI 는 "이 요리에 마늘이 많이 들어갔어요"라고 말해줍니다 (설명). 하지만 "마늘이 왜 이 환자에게 나쁜지, 마늘이 몸속에서 어떻게 혈당을 높이는지"에 대한 **의학적인 이야기 (지식)**는 전혀 들려주지 않습니다.

저자는 이 차이를 53 대 1이라는 압도적인 격차로 발견했습니다. 즉, "무엇이 중요한지"는 잘 말해주지만, "왜 중요한지"에 대한 **의학 지식 (Knowledge Graph)**을 연결하는 연구는 거의 없다는 뜻입니다.

이 논문은 이 문제를 해결하기 위해 **새로운 3 단계 요리법 (프레임워크)**을 제안합니다.

1 단계 (예측): AI 가 데이터를 보고 "당뇨병 위험 80%"라고 예측합니다. (마치 요리사가 요리를 완성하는 단계)
2 단계 (설명): AI 가 "체중이 30%, 혈당이 20% 영향을 줬어요"라고 숫자로 설명합니다. (마치 요리사가 "마늘을 많이 썼어요"라고 말하는 단계)
3 단계 (지식 - 새로운 제안!): **의학 지식 데이터베이스 (지식 그래프)**를 연결합니다.
- "체중이 많으면 -> 인슐린 저항성이 생기고 -> 혈당이 오르고 -> 당뇨병이 됩니다."
- 이렇게 의사가 이해할 수 있는 의학적인 이야기로 설명해 주는 단계입니다.

이제 AI 는 단순히 "위험합니다"라고 말하는 것을 넘어, **"체중이 많아서 인슐린이 제 기능을 못 하므로 당뇨병 위험이 높습니다"**라고 이유까지 설명해 줄 수 있게 됩니다.

지역 불균형: 이 연구는 주로 중국, 미국, 인도에서 많이 이루어졌습니다. 당뇨병 환자가 급증하고 있는 동남아시아나 아프리카 등 개발도상국의 연구는 거의 없습니다. 마치 부자 나라만 고급 요리를 연구하고, 가난한 나라의 식탁은 무시하는 상황과 같습니다.
데이터의 한계: 많은 연구가 1988 년에 수집된 아주 작은 데이터 (768 명) 를 사용합니다. 현대의 거대한 인구 데이터를 제대로 활용하지 못하고 있어, 실제 병원이나 사회에 적용하기엔 아직 부족합니다.

이 논문은 **"AI 가 당뇨병을 예측하는 기술은 이미 훌륭하지만, 의사들이 이해하고 환자에게 설명할 수 있도록 '의학적인 이유'를 덧붙이는 기술이 필요하다"**고 말합니다.

앞으로는 AI 가 단순한 계산기를 넘어, 의학 지식을 갖춘 훌륭한 상담사가 되어야 합니다. 그래야만 환자들이 AI 의 판단을 믿고, 더 나은 건강 관리를 할 수 있을 것입니다.

한 줄 요약:

"AI 는 당뇨병 위험을 잘 예측하지만, '왜' 위험한지에 대한 의학적인 이유를 설명하지 못합니다. 이제 AI 에게 의학 지식을 가르쳐서, 의사처럼 '이유'까지 설명해 주는 친구로 만들어야 합니다!"

A Bibliometric Review of Explainable AI in Diabetes Risk Prediction: Trends, Gaps, and Knowledge Graph Opportunities