Panmap: Scalable phylogeny-guided alignment, genotyping, and placement on pangenomes
本論文は、進化構造を活用して数百万規模のゲノムを含むパンゲノムに対して、読み取り配列の配置、アラインメント、遺伝子型決定を高速かつ効率的に行う新ツール「Panmap」を提案し、従来の手法と比較してインデックスサイズを最大 600 倍、構築時間を 3 桁以上削減したことを報告しています。
1243 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、進化構造を活用して数百万規模のゲノムを含むパンゲノムに対して、読み取り配列の配置、アラインメント、遺伝子型決定を高速かつ効率的に行う新ツール「Panmap」を提案し、従来の手法と比較してインデックスサイズを最大 600 倍、構築時間を 3 桁以上削減したことを報告しています。
本研究は、Vertebrate Genomes Project の高品質なゲノムアセンブリと PacBio HiFi シーケンシングデータを活用し、82 種の脊椎動物を対象としたスケーラブルな計算フレームワークを開発することで、転写開始点を中心とした低メチル化という保存されたプロモーターメチル化パターンと、系統群特有の多様性を明らかにし、脊椎動物の進化的関係を反映する比較エピゲノム枠組みを確立しました。
本論文は、大規模な k-mer に対してランダム・ミニマイザーや既存の最先端手法よりも低い密度(サンプリング効率)を達成し、特に k が無限大に近づく場合に最適密度を実現する単純かつ効率的なサンプリングアルゴリズム「mod-minimizer」を提案し、ヒトゲノムインデックスのメモリ使用量を 15% 削減する実証結果を示したものである。
本論文は、7 つの計算手法を 10 種類の臓器システムでベンチマークし、その相補的な強みを活かして細胞アトラスを段階的に拡張・統合するための枠組みを提示したものである。
本論文は、最小限のラベルから専門家による反復的改善を経て 3D 学習データへと拡張するカスケード型ワークフロー「DeepBranchAI」を提案し、これによりミトコンドリアや血管などの複雑な分岐ネットワークのセグメンテーションにおいて、注記時間を大幅に短縮しつつ高い精度と汎用性を達成したことを示しています。
この論文は、ランレングス圧縮された BWT 上のランレングス圧縮スキップリストを導入することで、92 個の全ヒトゲノムを含む 5.8GB の動的な GBWT を効率的に構築・検索可能にし、シンクマーグラフを用いたパンゲノム操作における時間と空間の効率性を大幅に向上させたことを報告しています。
単細胞解析により、くも膜下出血後の脳内出血において、急性期の活性化ミクログリアから分泌された TNF-αが単球を介して神経修復を促進し、良好な神経予後と関連していることが明らかになりました。
本研究では、自然環境下での生物の適応メカニズムを解明するため、環境要因と生理応答の時系列データから信号の重要度を推定する機械学習フレームワーク「Inverse Signal Importance(ISI)」を開発し、メダカの性腺発達における環境信号の動的な優先順位付けと遺伝子発現の関連性を明らかにしました。
本論文は、CCTBX および Phenix ソフトウェアに、Urzhumtsev と Lunin が提案した局所分解能を考慮した新しい原子モデル密度マップ計算手法を実装し、実験データとの照合精度を向上させたことを報告するものである。
この論文は、NVIDIA GPU に依存する閉鎖的な Oxford Nanopore 社製ソフトウェアの代替として、ハードウェアに依存せずオープンソースで提供される高性能なナノポア塩基配列決定ライブラリ「Openfish」とフレームワーク「Slorado」を提案し、研究や実用におけるハードウェアのロックインを解消するものである。