Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

Este estudo desenvolveu e validou um modelo de processamento de linguagem natural baseado em BERT para extrair e categorizar automaticamente diversos tipos de violência e seus contextos a partir de registros eletrônicos de saúde mental, alcançando alto desempenho na maioria das categorias, exceto na identificação temporal de eventos passados.

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.

Publicado 2026-03-26
📖 4 min de leitura☕ Leitura rápida
⚕️

Esta é uma explicação gerada por IA de um preprint que não foi revisado por pares. Não é aconselhamento médico. Não tome decisões de saúde com base neste conteúdo. Ler aviso legal completo

Each language version is independently generated for its own context, not a direct translation.

Imagine que os prontuários médicos de pacientes de saúde mental são como livros de diários gigantes e cheios de segredos. Nesses livros, os médicos escrevem tudo o que acontece com o paciente: seus medos, suas dores e, infelizmente, também relatos sobre violência que eles sofreram ou viram.

O problema é que esses relatos sobre violência estão "escondidos" no meio de textos longos e confusos, escritos à mão ou digitados livremente. Ninguém consegue ler milhões desses livros à mão para encontrar quem sofreu violência, quando e como. É como tentar achar uma agulha em um palheiro, só que o palheiro é um oceano de palavras.

A Missão: O Detetive de Palavras (IA)

Os pesquisadores da King's College London, em Londres, decidiram criar um detetive digital (um programa de computador inteligente, chamado de NLP ou Processamento de Linguagem Natural) para fazer esse trabalho chato por nós.

Eles queriam que esse detetive fosse muito esperto. Não bastava apenas dizer "aqui tem violência". Eles queriam que o detetive respondesse a perguntas como:

  • Que tipo de violência foi? (Física, sexual, emocional ou financeira?)
  • Quem foi o protagonista? (O paciente foi a vítima, o agressor ou apenas um espectador?)
  • Onde aconteceu? (Em casa, com a família, ou em outro lugar?)
  • Quando aconteceu? (Foi ontem ou foi há 10 anos?)
  • É real ou apenas uma ameaça? (Aconteceu de verdade ou foi só uma ameaça?)

Como eles treinaram o Detetive?

Para ensinar esse computador a ser um bom detetive, os pesquisadores precisaram de um "treinamento intensivo".

  1. A Caça ao Tesouro: Eles vasculharam milhões de registros e pegaram trechos de texto que continham palavras-chave como "briga", "golpe", "medo", "dinheiro", "coerção".
  2. O Treinamento Humano: Eles pegaram 6.500 desses trechos e pediram para dois especialistas humanos (os "mestres do treinamento") lerem cada um e anotarem tudo o que o computador precisava aprender. Eles criaram um "manual de instruções" muito detalhado para garantir que todos estivessem na mesma página.
  3. A Lição de Casa: Com esses exemplos anotados, eles "alimentaram" o computador. O computador leu 90% dos exemplos para aprender os padrões e depois foi testado nos 10% restantes, que ele nunca tinha visto antes (como uma prova final).

O Resultado: Um Detetive Muito Bom (mas com uma fraqueza)

O resultado foi impressionante! O computador aprendeu muito bem a identificar:

  • Violência Emocional e Financeira: Conseguia detectar quando alguém estava sendo humilhado ou controlado financeiramente com uma precisão de quase 90%.
  • Papéis: Entendeu muito bem quem era a vítima e quem era o agressor.
  • Acontecimentos Reais: Foi excelente em distinguir quando a violência realmente aconteceu versus quando era apenas uma ameaça.

Onde ele tropeçou?
O computador teve dificuldade em entender o tempo. Diferente de um filme, os médicos muitas vezes escrevem no passado ("ele foi agredido") ou de forma vaga ("ele teve problemas no passado"). Para o computador, foi difícil saber se aquilo aconteceu ontem ou há dez anos. Foi como tentar adivinhar a idade exata de alguém apenas olhando para uma foto antiga sem data.

Por que isso é importante?

Antes, os pesquisadores tinham que ler esses textos manualmente, o que era lento e difícil de fazer em grande escala. Agora, com essa ferramenta, eles podem "ler" milhões de prontuários em segundos.

Isso é como ganhar um superpoder para a pesquisa médica. Agora, os cientistas podem descobrir padrões que antes eram invisíveis. Eles podem responder perguntas como: "Pessoas que sofreram violência financeira têm mais risco de depressão?" ou "A violência doméstica afeta o tratamento de ansiedade de forma diferente dependendo da idade?".

Resumo da Ópera

Essa pesquisa criou um robô leitor de histórias que consegue entender a complexidade da violência nos registros médicos. Ele não substitui o médico, mas funciona como um filtro inteligente que organiza o caos de informações, permitindo que a ciência entenda melhor a relação entre violência e saúde mental, para que no futuro possamos ajudar as pessoas de forma mais eficaz.

É como se, pela primeira vez, conseguíssemos ouvir a "voz" de milhões de pacientes que antes estava perdida em meio a milhões de páginas de texto.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →