Systematic contextual biases in SegmentNT potentially relevant to other nucleotide transformer models
본 논문은 시퀀스 길이, 뉴클레오타이드 위치, 그리고 토큰화와 연관된 24-뉴클레오타이드 주기적 진동을 특히 고려할 때 SegmentNT 뉴클레오타이드 트랜스포머 모델에 존재하는 체계적인 문맥 편향을 식별하고 특징화하며, 예측 일관성을 향상시키고 유사한 유전체 모델의 사용을 안내하기 위한 표준화 방법을 제안합니다.