aaKomp: Alignment-free amino acid k-mer matching for genome completeness assessment at scale
本研究は、従来のアラインメントベース手法に比べて大幅な高速化と低メモリ消費を実現し、ユーザー定義の参照データベースによる柔軟な評価を可能にする、大規模ゲノム完全性評価のための新しいアラインメントフリーツール「aaKomp」を提案するものである。
1243 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、従来のアラインメントベース手法に比べて大幅な高速化と低メモリ消費を実現し、ユーザー定義の参照データベースによる柔軟な評価を可能にする、大規模ゲノム完全性評価のための新しいアラインメントフリーツール「aaKomp」を提案するものである。
本論文は、植物ゲノム中の ATHILA LTR 逆転写トランスポゾンを高精度かつ大規模に検出するための専用パイプライン「ATHILAfinder」を開発し、既存ツールを上回る性能で Brassicaceae 科植物におけるその進化動態の解明に成功したことを報告しています。
この論文は、従来の設計された生物学的特徴を必要とせず、配列情報のみからマイクロRNAの結合部位と遺伝子発現抑制を高精度に予測する新しい深層学習モデル「miRBind2」を開発し、既存の手法を凌駕する性能を実証したものである。
本論文は、転写・翻訳・タンパク質のトリオミクスデータをテンソル分解で統合解析する新規手法を開発し、リボソームのスタッキングや翻訳緩衝といった機能的に重要な遺伝子クラスターと細胞運命転換のメカニズムを特定したことを報告しています。
中国の 2 都市から採取された 58 件の都市土壌サンプルを対象としたロングリードメタゲノムシーケンシングにより、97% 以上が未記載種である 4,171 種の新規微生物系統と、防御システムや可動性遺伝要素に関連する多数の小型タンパク質ファミリーを含む広範な機能的多様性が解明され、都市公共衛生への新たな示唆が得られました。
この論文は、コドン言語モデルとタンパク質言語モデルを組み合わせることで、遺伝変異の病原性決定要因が「生成物(タンパク質)」と「プロセス(コドン配列の制御)」の両方に依存し、変異の種類や実験プラットフォームによってその寄与度が異なることを明らかにしたものである。
本研究は、28 の結核遺伝子発現シグネチャと複数のコネクティビティ・スコアリング法を統合する計算ワークフローを開発し、既存の FDA 承認薬 64 種を宿主指向性治療薬として特定するとともに、新たな治療標的となる 12 の遺伝子を同定することで、結核治療における創薬の迅速化と新たな戦略の確立に貢献しました。
本論文は、長鎖リード配列データを活用してハプロタイプ分解されたパンゲノム参照に基づき、既存の手法よりも高精度に構造変異を検出するとともに、パンゲノムグラフの構築を約 10 倍高速化する「SVPG」という新たなアプローチを提案している。
本論文は、専門家の認知的階層を模倣し、機能基・ファーマコフォア・逆合成フラグメントの 3 つの視点からなる異種階層グラフと適応的知識融合モジュールを導入することで、既存のグラフニューラルネットワークを凌ぐ汎用的な分子物性予測を実現する「PyrMol」という知識構造化ピラミッドグラフフレームワークを提案しています。
Dingent は、多様なデータソースからの自然言語による効率的な検索と統合を可能にする、Web インターフェースを備えた柔軟な構成が可能なエージェントフレームワークであり、地球科学や生態学などの分野への応用が期待されます。