SCiMS: Sex Calling in Metagenomic Sequences
SCiMS は、メタゲノム配列データから宿主 DNA の性染色体リード密度比をベイズ分類器で解析することで、宿主 DNA が極めて少ないサンプルであっても高精度に宿主の性別を推定し、微生物叢研究における欠落した性別メタデータの復元と品質管理を可能にする新しいバイオインフォマティクスツールです。
1250 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
SCiMS は、メタゲノム配列データから宿主 DNA の性染色体リード密度比をベイズ分類器で解析することで、宿主 DNA が極めて少ないサンプルであっても高精度に宿主の性別を推定し、微生物叢研究における欠落した性別メタデータの復元と品質管理を可能にする新しいバイオインフォマティクスツールです。
この論文は、12 のコホートを対象としたメタ分析を通じて、乳児の腸内ウイルス叢(バイローム)が出生後 8 ヶ月で多様性が急増し、その後は安定化に向かって予測可能な成功継過程をたどることを明らかにし、疾患関連の異常を検出するための基盤を提供しました。
本研究は、タンパク質言語モデルによる大まかな酵素分類と構造ベースのアプローチによる詳細分類を組み合わせることで、従来の手法よりも高精度かつ高効率に酵素の機能(EC 番号)を予測する新しい手法「DEFT」を開発し、腸内細菌のムチン分解酵素の解析を通じてその有効性を実証したものである。
本論文は、生物学的関連性予測における既存の評価手法が持つバイアスを解消し、公平かつ堅牢な学習を可能にする「エンティティバランス評価フレームワーク」とモデル非依存の学習戦略「UnbiasNet」を提案し、ドラッグターゲット相互作用やドラッグ相乗効果予測などのタスクにおいて、既存手法の限界を明らかにするとともに、意味のある生物学的関連性の特定を可能にする厳密な基盤を確立したものである。
本研究は、ProteinGym データセットを用いた評価により、現在のゼロショットモデルが単一変異や非エピスタシス的な変異の組み合わせについては性能を発揮するものの、強いエピスタシスを伴う変異の組み合わせによるタンパク質機能への影響を予測する能力は欠如していることを明らかにし、複雑な変異相互作用の把握の重要性を浮き彫りにしています。
本研究は、ヒト iPS 細胞から誘導した軟骨様組織におけるヒト特異的 lncRNA の発現解析を通じて、二足歩行に適応した軟骨形成の分子機構を解明し、その制御による再生医療への応用やヒト特有の疾患メカニズムの理解に貢献する可能性を示しました。
本論文は、バクテリアのゲノムをプレフィックスベースのダウンサンプリング手法で縮小し、k-mer 頻度行列を用いたアンサンブル学習モデルが、限られたデータや高類似ゲノムにおいても複雑な深層学習モデルを上回る表現型予測精度と解釈可能性を達成することを示しています。
既存の深層学習モデルが実世界での創薬加速において限界を示す中、本論文は結合ポケットの類似性やタンパク質間相互作用などの知識グラフを基にグラフ変換器を用いた新たな手法「PIGLET」を提案し、厳密なドラッグベース分割において他モデルを上回る性能を示すとともに、実世界の創薬事例を通じてその有用性を実証しています。
本論文は、大規模言語モデルと検索強化生成(RAG)を活用した自律型マルチエージェントフレームワーク「KG-Orchestra」を提案し、生体医学知識グラフの自動構築と証拠に基づく詳細化を通じて、スケーラビリティと生物学的妥当性を両立させる手法を明らかにしたものである。
本研究では、ブルセラ症の主要な病原菌であるブルセラ・メリテンシスのタイプ IV 分泌系(T4SS)の構造を計算機シミュレーションにより解明し、その ATP 酵素サブユニットの二量体界面を標的とした仮想スクリーニングにより、エゼチミブなどの既存薬を抗ウィルス性療法薬として再利用する可能性を示しました。