Systematic contextual biases in SegmentNT potentially relevant to other nucleotide transformer models
本論文は、SegmentNT 核酸トランスフォーマーモデルにおける体系的な文脈バイアスを特定・特徴付けし、具体的には入力配列長、ヌクレオチド位置、およびトークナイズに起因する 24 塩基周期振動に関するバイアスを明らかにするとともに、予測の一貫性を向上させ、同様のゲノムモデルの利用を導くための標準化手法を提案する。