AI-Generated Responses to Patient's Messages: Effectiveness, Feasibility and Implementation

네덜란드 학술병원에서 실시한 이 연구는 환자 메시지 응답을 위한 생성형 AI 도구가 초기 기대와 달리 시간 절약 및 업무 효율성 측면에서 제한적인 효과를 보였으며, 사용률과 만족도가 시간이 지남에 따라 감소한 혼합된 결과를 도출하고, 이를 통해 기대치 관리, 워크플로우 개선 및 품질 기준 마련의 필요성을 강조했습니다.

Bladder, K. J. M., Verburg, A. C., Arts-Tenhagen, M., Willemsen, R., van den Broek, G. B., Driessen, C. M. L., Driessen, R. J. B., Robberts, B., Scheffer, A. R. T., de Vries, A. P., Frenzel, T., Swillens, J. E. M.

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🏥 배경: 의료진의 '메시지 폭주' 문제

병원 의료진 (의사, 간호사 등) 들은 매일 환자들이 보내는 수많은 메시지 (질문, 검사 결과 문의 등) 에 시달립니다. 이는 마치 폭포수처럼 쏟아지는 우편물을 매일 손으로 하나하나 읽고 답장해야 하는 상황과 같습니다. 이 업무량 때문에 의료진이 지치고 번아웃 (소진) 을 겪는 경우가 많았죠.

그래서 병원에서는 **Epic 이라는 AI 도구 (Art)**를 도입했습니다. 이 AI 는 환자의 메시지를 읽고, 환자의 진료 기록을 참고해서 초안 답장을 자동으로 써주는 역할을 합니다. "AI 비서가 초안을 써주면, 의료진은 그걸 다듬기만 하면 되겠지?"라고 기대했습니다.

🔍 실험: 6 개월간의 'AI 비서' 테스트

연구팀은 피부과, 폐과, 암센터, 이비인후과 등 4 개 진료과목의 의료진 237 명을 대상으로 6 개월간 이 도구를 사용하게 했습니다. 그리고 세 가지 질문을 던졌습니다.

  1. 효과성: 실제로 시간이 절약되고 일이 쉬워졌을까?
  2. 현실성: 사람들이 이 도구를 계속 쓸까?
  3. 문제점: 무엇이 걸림돌이었을까?

📊 결과: "초기 기대는 높았으나, 현실은 차가웠다"

1. 시간 절약 효과는 '미미'했습니다

연구팀은 "AI 가 답장 초안을 써주면 시간이 많이 절약되겠지?"라고 생각했지만, 결과는 달랐습니다.

  • 비유: AI 가 초안을 써주긴 했지만, 의료진은 그 초안을 100% 믿고 보낼 수 없어서 다시 꼼꼼히 확인하고 고쳐야 했습니다. 마치 아기에게 글을 쓰게 했을 때, 부모님이 다시 한 번 교정해야 하는 것과 비슷합니다.
  • 결과적으로, AI 를 썼을 때와 쓰지 않았을 때의 소요 시간은 거의 차이가 없었습니다. 오히려 확인하는 데 시간이 더 걸리기도 했습니다.

2. 사용률은 '초반 열기' 후 '급감'했습니다

  • 초반: AI 도구를 처음 도입했을 때는 많은 사람이 "신기하다", "좋겠다"라며 사용했습니다.
  • 후반: 6 개월이 지나자 사용률은 16.7% 수준으로 떨어졌습니다. 사람들은 "이게 내 스타일이 아니야", "내용이 틀려", "확인하는 게 더 귀찮아"라고 생각하며 다시 직접 타이핑하는 방식으로 돌아갔습니다.

3. 의료진의 만족도는 '하락'했습니다

  • 기대: "일감이 줄어들고 스트레스가 사라지겠지?"
  • 현실: "AI 가 쓴 답장이 의학적 오류를 포함하거나, 환자에게 필요한 조언을 놓치는 경우가 많았다."
  • 특히 AI 가 환자의 성별을 잘못 부르거나, 약물을 잘못 언급하는 등 사소한 실수가 종종 발생했습니다. 의료진들은 "실수가 하나라도 있으면 큰일 나니까, 처음부터 내 손으로 쓰는 게 낫겠다"라고 판단했습니다.

🚧 장애물과 기회 (왜 안 됐고, 어떻게 고쳐야 할까?)

❌ 문제점 (장애물):

  • 정확성 부족: AI 가 환자가 묻는 복잡한 질문을 제대로 이해하지 못하거나, 진료 기록을 잘못 읽는 경우가 있었습니다.
  • 스타일 불일치: AI 가 쓴 글이 너무 딱딱하거나, 의료진 특유의 따뜻한 어조와 달랐습니다.
  • 신뢰 부족: "이걸 그대로 보내면 의료 과실이 아닐까?"라는 불안감이 있었습니다.

✅ 긍정적인 점 (기회):

  • 뼈대 제공: 비록 다듬어야 했지만, 빈 종이에 글쓰기보다는 초안이 있는 상태에서 수정하는 것이 나쁘지 않았습니다.
  • 감정적 표현: AI 가 환자에게 예의를 갖추는 문장을 잘 써주어, 의료진이 감정적인 부분에 집중할 시간을 조금 더 벌 수 있었습니다.

💡 결론 및 제언: "AI 는 '비서'일 뿐, '주인'은 의료진이다"

이 연구의 결론은 **"AI 가 아직 완벽하지 않다"**는 것입니다. 하지만 포기할 필요는 없습니다.

  1. 기대치 조절: AI 가 모든 일을 대신해 줄 '마법 지팡이'가 아니라, **초안을 잡아주는 '보조 도구'**로 받아들이는 것이 중요합니다.
  2. 피드백 시스템: 의료진이 "여기가 틀렸다", "이렇게 고쳐줘"라고 말하면 AI 가 그걸 학습해서 더 똑똑해져야 합니다.
  3. 명확한 규칙: "AI 가 쓴 글은 반드시 의료진이 최종 확인해야 한다"는 원칙을 명확히 해야 합니다.

한 줄 요약:

"AI 비서를 고용했더니, 처음엔 신기했지만 실수가 너무 많고 확인하는 게 더 귀찮아서 다시 직접 일하는 게 낫겠다고 생각한 의료진들의 이야기. 하지만 잘만 다듬으면 미래에는 아주 훌륭한 파트너가 될 수 있다는 희망도 함께 담았습니다."

이 연구는 AI 를 의료 현장에 도입할 때, 기술만 좋으면 된다는 생각보다는 사람 (의료진) 의 경험과 신뢰를 어떻게 쌓아갈지 고민해야 함을 일깨워줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →