DeepTrio: Variant Calling in Families Using Deep Learning
この論文は、親と子のトリオデータから直接学習し、シーケンシング誤差や突然変異率を自動的に重み付けすることで、従来の DeepVariant よりも特に低カバレッジ条件下で高精度なバリアント検出を実現する深層学習ベースのツール「DeepTrio」を提案しています。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、親と子のトリオデータから直接学習し、シーケンシング誤差や突然変異率を自動的に重み付けすることで、従来の DeepVariant よりも特に低カバレッジ条件下で高精度なバリアント検出を実現する深層学習ベースのツール「DeepTrio」を提案しています。
本論文は、トウモロコシの形質予測において、単純平均よりも個体モデルの重み付けを最適化(線形変換、ネルダー・ミード法、ベイズ法)することで予測精度を向上させることを示し、重み付け最適化のさらなる可能性を提言しています。
本研究は、異なるマーカーパネルから学習可能な可解釈な事前学習型トランスフォーマー「GPCT」を提案し、フローサイトメトリー分野におけるスケーラブルかつ一般化されたサンプルレベルの予測モデルと生物学的検証の基盤を確立したことを示しています。
既存の等方的な知識ベースポテンシャルの限界を克服し、原子の方向性を考慮した非等方的な確率モデル「DESPOT」を提案することで、タンパク質 - リガンド相互作用のスコアリングや結合部位の特性評価において、姿勢識別や仮想スクリーニングの精度を大幅に向上させた。
本論文は、TCR-ペプチド結合予測において構造情報がノイズを含む場合でも、CLIP 風の対照的アライメントを導入してモダリティ間の整合性を制約する軽量フレームワーク「TRACE」を提案し、単純な融合では性能が劣化する問題に対して安定した予測精度の向上を実現することを示しています。
本論文は、大腸菌における多様な細胞応答データ(プロテオーム、化学構造、成長動態など)を統合し、抗菌薬の作用機序を高精度に予測するとともに新規メカニズムを持つ化合物を検出する新しいフレームワーク「MAPPER」を開発したことを報告しています。
この論文は、長リード配列を用いた真菌 ITS コミュニティの種レベルの存在量推定を、単純な最良ヒット分類の限界を克服し、期待値最大化法(EM)を採用した高性能な Rust ツール「EMITS」によって可能にする手法を提案し、シミュレーションおよびモックコミュニティを用いた検証でその精度向上を実証したものである。
本論文は、極端なクラス不均衡に直面する SARS-CoV-2 バリアント分類において、深層学習よりも TF-IDF ベースの k-mer 特徴量を用いた古典的およびハイブリッド機械学習モデル(特に RF-SVM)が、希少変異の検出精度と一般化能力において優れていることを示しています。
この研究は、86 種類の推定設定による SNP 遺伝率の推定値が大幅に変動するにもかかわらず、その変動がポリジニックリスクスコア(PRS)の性能にはほとんど影響を与えないことを示し、遺伝率推定値は設定に依存するパラメータとして解釈すべきであり、PRS 性能は遺伝率入力の変動に対して比較的頑健であることを結論付けています。
この論文は、マラリア対策における蚊の殺虫剤耐性を評価する際、従来の判別濃度生物試験に加え、より感度の高い強度濃度生物試験のデータを取り入れた新たな数学モデルを開発し、野外の実験小屋試験での蚊の死亡率を高精度に予測することで、耐性モニタリング結果を公衆衛生への影響評価に統合する手法を提案しています。