Automatic identification of diagnosis from hospital discharge letters via weakly supervised Natural Language Processing
Questo articolo presenta una pipeline di elaborazione del linguaggio naturale debolmente supervisionata che identifica automaticamente le diagnosi dei pazienti dalle lettere di dimissioni ospedaliere italiane sfruttando l'estrazione di frasi, embedding semantici specifici del dominio e il clustering a due livelli per generare etichette deboli, raggiungendo così prestazioni paragonabili ai modelli completamente supervisionati pur riducendo significativamente la necessità di annotazione manuale.