Accurate detection of mosaic mutations at short tandem repeats from bulk sequencing data
BulkMonSTR は、機械学習と STR 固有のエラーモデリングを組み合わせることで、バルクシーケンシングデータから高精度にモザイク変異を検出する計算フレームワークであり、老化や疾患への寄与を解明するための基盤を提供する。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
BulkMonSTR は、機械学習と STR 固有のエラーモデリングを組み合わせることで、バルクシーケンシングデータから高精度にモザイク変異を検出する計算フレームワークであり、老化や疾患への寄与を解明するための基盤を提供する。
本論文は、構造情報なしに配列のみからタンパク質間結合親和性を予測し、説明可能性とデータ効率性を兼ね備えた新たなフレームワークを提案し、抗体最適化や創薬において構造ベース手法を上回る性能を実証したものである。
IMMREP25 競技では、実験データが存在しない「未見」ペプチドに対する TCR:pMHC 結合予測において、構造的モデリングを取り入れた手法がランダム推測を有意に上回る精度を達成し、この分野の重要な進展を示しました。
この論文は、単細胞転写データから個々の細胞の概日位相を推定し、生物学的な脱同期と技術的ノイズを区別して定量化する確率的フレームワーク「scRitmo」を開発し、多様な組織や生物種における概日リズムの協調性を解析する手法を提示したものである。
GLP-1R のコンフォメーション可変性を考慮した統合的計算・実験戦略により、ペプチドおよび非ペプチド性の多様なアゴニスト候補を同定し、その中でペンタペプチドである DPDPE が GLP-1 に匹敵する効果を示す有望なリード化合物であることを実証しました。
本研究は、従来の直線型ゲノム参照に代わるヒトパンゲノム参照を用いることで、特に東アジア系個体において体細胞変異の検出精度が向上し、祖先に起因するバイアスを軽減できることを実証した。
本論文は、タンパク質言語モデルと残差ネットワーク、拡張畳み込みを組み合わせた新しい深層学習モデル「emb2dis」を提案し、CAID3 ベンチマークで Disorder-PDB カテゴリにおいて第 1 位となる高い精度でタンパク質の内在性無秩序領域を予測できることを示しています。
この論文は、パシフィック・バイオサイエンスの HiFi シーケンシング技術を用いて得られた複雑なメタゲノムアセンブリから円形メタゲノムアセンブリ(cMAGs)を可視化し、細菌の病原性や薬剤耐性に関わる遺伝子の分布と文脈を包括的に理解するためのオープンソースツール「VicMAG」を開発し、その有用性を示したものである。
Baktfold は、ProstT5 と Foldseek を活用してタンパク質構造情報を基に微生物のゲノムを高速かつ高感度に機能注釈する新たなコマンドラインツールであり、従来の手法よりもはるかに多くの仮説タンパク質の機能を解明できることを示しています。
本論文は、事前学習されたタンパク質言語モデル(ESM-2)と構造確率デコーダを組み合わせた「PSALM」という手法を提案し、従来の HMMER と同等の感度・特異度 tradeoff を達成しつつ、特に緩和された閾値条件下で UniProtKB におけるドメインアノテーションのカバレッジを向上させることを示しています。