Protein sequence domain annotation using a language model
O artigo apresenta o PSALM, um novo método de anotação de domínios proteicos que combina um modelo de linguagem pré-treinado (ESM-2) com um classificador e um decodificador probabilístico estruturado, alcançando um desempenho comparável ao HMMER em benchmarks de larga escala e oferecendo maior cobertura em limiares de confiança mais relaxados.