A medical coding language model trained on clinical narratives from a population-wide cohort of 1.8 million patients

Este estudo apresenta um modelo de linguagem treinado em 5,8 milhões de registros de saúde de 1,8 milhão de pacientes na Dinamarca que não apenas automatiza a codificação médica com alta precisão, mas também revela uma subcodificação sistemática de diagnósticos secundários, sugerindo que a aplicação dessa tecnologia pode corrigir lacunas críticas em dados de saúde pública e pesquisa epidemiológica.

Joakim Edin, Sedrah Butt Balaganeshan, Annike Kjølby Kristensen, Lars Maaløe, Ioannis Louloudis, Søren Brunak

Publicado 2026-03-04
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que o sistema de saúde é uma biblioteca gigante onde cada paciente é um livro. Para que os livros sejam organizados, encontrados e usados para pesquisas futuras, eles precisam de etiquetas (códigos) que digam exatamente do que se trata a história de cada um. No mundo médico, essas etiquetas são chamadas de códigos ICD.

O problema é que, até hoje, colocar essas etiquetas era feito manualmente por pessoas cansadas, que tinham que ler pilhas de anotações médicas. Era como tentar encontrar um livro específico em uma biblioteca escura, sem luz, apenas com uma lanterna fraca. Isso levava muito tempo, era caro e, pior, muitas vezes as pessoas erravam ou esqueciam de colocar etiquetas importantes.

Aqui entra este estudo, que é como se fosse a introdução de um novo robô bibliotecário superinteligente.

O que os pesquisadores fizeram?

Eles pegaram um robô (uma Inteligência Artificial) e o treinaram com uma quantidade absurda de dados: 5,8 milhões de registros médicos de 1,8 milhão de pacientes na Dinamarca. É como se eles tivessem ensinado o robô a ler quase metade dos livros de toda a biblioteca dinamarquesa por dez anos.

O robô aprendeu a ler as anotações dos médicos, os resultados de exames e as receitas de remédios para tentar adivinhar quais etiquetas (códigos) deveriam ser coladas no "livro" do paciente.

O que eles descobriram?

1. O robô é muito bom, mas não é perfeito
O robô conseguiu acertar a etiqueta correta em cerca de 55% dos casos sozinho. Nos outros casos, ele conseguiu sugerir as 10 etiquetas mais prováveis, e a etiqueta correta estava quase sempre entre elas.

  • A analogia: Imagine que você está procurando uma agulha no palheiro. O robô não consegue pegar a agulha de imediato em todos os casos, mas ele consegue reduzir o "palheiro" de um celeiro inteiro para apenas uma pequena caixa. Isso torna o trabalho humano muito mais rápido.

2. O robô é melhor em algumas áreas do que em outras
O robô foi excelente em áreas como neurofisiologia (onde os testes são muito claros e padronizados), mas teve mais dificuldade em psiquiatria infantil ou em casos onde o paciente tem muitas doenças ao mesmo tempo.

  • A analogia: É como um jogador de xadrez que é um gênio em aberturas de jogo, mas se confunde quando o oponente faz jogadas muito estranhas e imprevisíveis. Quanto mais "bagunçado" e complexo o caso, mais difícil é para o robô.

3. A grande descoberta: O robô encontrou o que os humanos esqueceram!
Esta é a parte mais importante e surpreendente. O robô começou a sugerir etiquetas para doenças que os médicos e secretárias não tinham colocado nos registros.

  • O exemplo do "esquecimento": Eles analisaram casos de tentativas de suicídio, obesidade e pressão alta. O robô disse: "Ei, este paciente tem pressão alta, por que não colocamos a etiqueta?".
  • A verificação: Quando humanos olharam esses casos novamente, perceberam que o robô estava certo 76% a 86% das vezes. O problema não era o robô errando; era o sistema humano esquecendo de anotar essas doenças secundárias.
  • Por que isso acontece? Pense em um sistema de pagamento onde você só é pago se anotar a doença principal, mas não ganha nada extra por anotar as doenças secundárias. Os médicos, sobrecarregados e com pouco tempo, focam no principal e deixam o resto de lado. O robô, que não tem essa pressão financeira, lê tudo e aponta o que falta.

Por que isso é importante?

  1. Economia de tempo: Em vez de um humano procurar por horas em milhares de códigos possíveis, o robô entrega uma lista curta com as melhores opções.
  2. Melhor saúde pública: Se não anotamos corretamente quantas pessoas têm obesidade ou tentaram suicídio, o governo não sabe o tamanho do problema e não consegue criar políticas para resolver. O robô ajuda a "iluminar" esses dados escondidos.
  3. Um espelho para o sistema: O estudo mostrou que, às vezes, o erro não é da máquina, mas do processo humano. O robô está tão bem treinado que ele percebeu que os humanos estavam "esquecendo" de anotar coisas importantes.

Conclusão simples

Este estudo não diz que a Inteligência Artificial vai substituir os médicos ou os codificadores. Pelo contrário, ele mostra como a IA pode ser um super-assistente. Ela pode fazer o trabalho pesado de triagem, sugerir o que pode ter sido esquecido e garantir que a história completa do paciente seja contada corretamente.

É como ter um segundo par de olhos que nunca cansa, nunca se distrai e lembra de tudo o que foi dito, ajudando a construir um mapa de saúde mais preciso para todos nós.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →