On why and how to encode probability distributions on graph representations of omics data: enhancing predictive tasks and knowledge discovery
オミクスデータのグラフ表現に構造化された統計分布を統合する新たなフレームワークを提案し、がんの予後予測における競合的な性能の維持と、臨床結果に関連する生物学的な調節モジュールの同定による解釈性の向上を実現しました。
769 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
オミクスデータのグラフ表現に構造化された統計分布を統合する新たなフレームワークを提案し、がんの予後予測における競合的な性能の維持と、臨床結果に関連する生物学的な調節モジュールの同定による解釈性の向上を実現しました。
本論文は、分子動力学シミュレーションを用いた薬剤転用研究により、チクングニアウイルスの複製に不可欠な非構造タンパク質 nsP2 の活性部位を阻害し、ウイルス複製を妨げる有望な候補としてインディナビルを特定したことを報告しています。
本研究は、3 次元構造決定を不要とし、生化学的ルールに基づく 158 個の解釈可能な特徴量と ESM-2 埋め込みを組み合わせた「BioGraphX」を提案し、高精度かつ解釈性のあるタンパク質の細胞内局在予測を実現するとともに、パラメータ数を最小化してグリーン AI を促進するものである。
本論文は、アルツハイマー病のアミロイド蓄積を診断群や経時的な変化を維持しつつ連続的なスケーリングでモデル化する教師なし次元削減手法「SLOPE」を開発し、従来の指標よりも早期の病変進行を敏感に捉え、生物学的に整合性のあるアミロイド拡散パターンを明らかにしたことを報告しています。
この論文は、大規模な微生物参照ゲノムデータセットのインデックス構築におけるメモリ使用量のボトルネックを解消するため、確率的なフィンガープリント手法を用いてオンザフライで重複するカラーセットを特定・圧縮するモンテカルロアルゴリズムを提案し、限られたメモリとディスク空間で高精度に処理可能であることを示しています。
本論文は、姿勢推定や投影計算を不要とし、合成データを用いた教師あり学習によってノイズの多いクライオ-EM 画像から原子座標を直接予測する畳み込みオートエンコーダと回帰ネットワークの手法を提案し、その有効性を示したものである。
この論文は、生物学的に重要な部分配列を優先する「ガイド付きトークン化(GT)」とドメイン知識の活用により、コンパクトなゲノム言語モデルの表現力と分類精度を向上させ、DNA 配列分類や抗菌剤耐性分類などのタスクで効果的であることを示しています。
本論文は、公開生命科学データベースのメタデータキュレーションの遅れを解決するため、オープンウェイト大規模言語モデル(LLM)を用いた自動ワークフローを開発し、アラビダプシス RNA シーケンシングプロジェクトのメタデータ分類において、従来のキーワード検索を大幅に上回る高精度(F1>0.98)を達成し、スケーラブルで再現性のあるデータ再利用の基盤を確立したことを報告しています。
本論文では、腫瘍進行の空間的解析において単一解像度の限界を克服し、階層的な空間集約を通じて生物学的条件間でのマルチスケール構造を統計的に比較可能にする新しいフレームワーク「Wayfarer」を提案し、肺腺がんの Xenium データを用いてその有効性を実証しています。
SCiMS は、メタゲノム配列データから宿主 DNA の性染色体リード密度比をベイズ分類器で解析することで、宿主 DNA が極めて少ないサンプルであっても高精度に宿主の性別を推定し、微生物叢研究における欠落した性別メタデータの復元と品質管理を可能にする新しいバイオインフォマティクスツールです。