Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

이 논문은 영국 남동부 런던의 정신건강 진료 기록에서 다양한 형태의 폭력과 관련된 정보를 추출하고 분류하기 위해 다중 레이블 BERT 모델을 활용한 자연어 처리 애플리케이션을 개발하여, 기존 연구보다 폭력 식별 성능을 크게 향상시켰음을 보고합니다.

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.

게시일 2026-03-26
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"정신과 진료 기록 속에 숨겨진 폭력의 흔적을 찾아내는 AI 비서"**를 개발한 연구입니다.

기존의 정신과 기록은 주로 의사가 쓴 자유 형식의 글 (문장) 로 되어 있어, 컴퓨터가 자동으로 "폭력"이나 "학대" 같은 중요한 정보를 찾아내기 매우 어려웠습니다. 이 연구팀은 마치 수천 장의 두꺼운 문서 더미 속에서 특정 키워드를 찾아내는 초능력을 가진 AI를 훈련시켜, 그 숨겨진 이야기들을 체계적으로 읽어내는 방법을 만들었습니다.

이 연구의 핵심 내용을 일상적인 비유로 설명해 드리겠습니다.


1. 왜 이 연구가 필요했을까요? (문제 상황)

정신과 환자들은 종종 과거의 폭력 경험 (신체적, 성적, 정서적, 금전적 학대 등) 을 이야기합니다. 하지만 의사가 진료 기록을 쓸 때, 이 중요한 내용은 딱딱한 '체크박스'로 남지 않고 의사의 손글씨 (또는 타이핑) 로 된 긴 문장 속에 섞여 있습니다.

  • 비유: 마치 거대한 도서관에 폭력 경험이 있는 사람들의 이야기가 수천 권의 책 속에 숨겨져 있는데, 도서관 사서 (컴퓨터) 가 그 책들을 찾아내지 못하고 있는 상황입니다. 연구팀은 이 숨겨진 이야기를 찾아내는 **스마트한 도서관 사서 (AI)**를 만든 것입니다.

2. 무엇을 만들었나요? (해결책)

연구팀은 BERT 라는 이름의 똑똑한 AI 모델을 훈련시켰습니다. 이 AI 는 단순히 "폭력이 있다/없다"라고만 판단하는 게 아니라, 다음과 같은 세부적인 특징까지 읽어낼 수 있습니다.

  • 폭력의 종류: 주먹질 (신체적), 성폭력, 말로 하는 상처 (정서적), 돈 문제 (금전적) 등.

  • 역할: 환자가 폭력을 **당한 사람 (피해자)**인지, **가한 사람 (가해자)**인지, 아니면 목격자인지.

  • 상황: 실제로 일어난 일인지, 위협인지, 아니면 과거의 일인지.

  • 장소: 집안일 (가족/연인 사이) 인지, 외부인지.

  • 비유: 이 AI 는 단순히 "폭력"이라는 단어를 찾는 게 아니라, **"누가, 언제, 어디서, 어떤 종류의 폭력을, 어떻게 당했거나 저질렀는지"**까지 파악하는 수사관과 같습니다.

3. 어떻게 훈련시켰나요? (과정)

AI 를 가르치기 위해 연구팀은 6,500 개의 진료 기록 조각을 준비했습니다.

  1. 전문가 교육: 먼저 인간 전문가 (연구자) 들이 이 기록들을 꼼꼼히 읽고 "이건 정서적 학대다", "이건 피해자다"라고 라벨을 붙이는 훈련을 했습니다.
  2. AI 학습: 이렇게 사람이 정답을 알려준 데이터를 AI 에게 보여줬습니다. AI 는 "아, 이런 문장 구조는 정서적 학대를 의미하는구나"라고 스스로 패턴을 학습했습니다.
  3. 시험: 학습이 끝난 AI 에게 새로운, 아직 보지 못한 기록을 주고 정답을 맞히게 했습니다.

4. 결과는 어땠나요? (성과)

AI 는 놀라운 성과를 보였습니다.

  • 성공한 부분: 정서적 학대, 금전적 학대, 신체적 폭력 등을 찾아내는 데 매우 뛰어났습니다. 특히 "집안일 (가족/연인 사이) 일 때 일어난 폭력"을 구분하는 능력도 탁월했습니다.
    • 비유: 이 AI 는 100 점 만점에 80~90 점을 받을 정도로 똑똑해졌습니다.
  • 아쉬운 부분: "언제 일어난 일인지 (과거인지 최근인지)"를 구분하는 것은 조금 어려웠습니다.
    • 이유: 진료 기록은 대부분 의사가 과거를 회상하며 적기 때문에, 시간 표현이 모호한 경우가 많아서 AI 가 헷갈린 것입니다. 마치 "옛날에 일어난 일"과 "최근에 일어난 일"을 구분하는 문장이 너무 비슷해서 AI 가 혼란을 겪은 것과 같습니다.

5. 이 연구가 가져올 변화는? (의미)

이 AI 도구를 사용하면, 앞으로 정신과 진료 기록을 분석할 때 폭력 경험과 정신 질환의 관계를 훨씬 더 정확하게 연구할 수 있게 됩니다.

  • 비유: 과거에는 폭력 경험을 가진 환자들을 찾기 위해 일일이 수작업으로 책을 뒤져야 했지만, 이제 이 AI 를 사용하면 수천 권의 기록을 순식간에 훑어내어 "폭력 경험이 있는 환자들"을 찾아내고, 그들이 어떤 정신적 고통을 겪는지 연구할 수 있게 된 것입니다.

요약

이 논문은 정신과 진료 기록 속에 숨겨진 폭력의 이야기를 찾아내는 'AI 탐정'을 개발했습니다. 이 AI 는 폭력의 종류와 상황을 아주 잘 파악하지만, '언제' 일어났는지는 조금 더 훈련이 필요합니다. 이 기술은 앞으로 정신 건강 연구와 환자 치료에 큰 도움을 줄 것으로 기대됩니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →