Protein sequence domain annotation using a language model
Le papier présente PSALM, une nouvelle méthode d'annotation des domaines protéiques qui combine un modèle de langage préentraîné (ESM-2) et un décodeur probabiliste structuré pour atteindre des performances comparables à HMMER tout en offrant une meilleure couverture des séquences à des seuils de confiance plus relâchés.