Systematic contextual biases in SegmentNT potentially relevant to other nucleotide transformer models
Este artigo identifica e caracteriza vieses contextuais sistemáticos no modelo de transformador de nucleotídeos SegmentNT — especificamente em relação ao comprimento da sequência de entrada, à posição do nucleotídeo e a uma oscilação periódica de 24 nucleotídeos vinculada à tokenização — e propõe métodos de padronização para melhorar a consistência das previsões e orientar o uso de modelos genômicos semelhantes.