Automatic identification of diagnosis from hospital discharge letters via weakly supervised Natural Language Processing
Este artigo apresenta um pipeline de Processamento de Linguagem Natural fracamente supervisionado que identifica automaticamente diagnósticos de pacientes a partir de cartas de alta hospitalar italianas ao alavancar a extração de sentenças, embeddings semânticos específicos do domínio e agrupamento de dois níveis para gerar rótulos fracos, alcançando assim um desempenho comparável a modelos totalmente supervisionados enquanto reduz significativamente a necessidade de anotação manual.