Protein sequence domain annotation using a language model
Il paper presenta PSALM, un metodo di annotazione dei domini proteici che combina un modello linguistico preaddestrato (ESM-2) con un classificatore per residuo e un decoder probabilistico strutturato, ottenendo prestazioni di rilevamento comparabili a HMMER su un vasto benchmark di 89 milioni di sequenze.