GraphPop: graph-native computation decouples population genomics complexity from sample count
本研究は、サンプル数に依存せず集団数に比例する計算量で集団ゲノミクス解析を可能にするグラフネイティブエンジン「GraphPop」を開発し、大規模データセットにおける高速かつメモリ効率的な統計計算と多様な解析の統合を実現したことを報告しています。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、サンプル数に依存せず集団数に比例する計算量で集団ゲノミクス解析を可能にするグラフネイティブエンジン「GraphPop」を開発し、大規模データセットにおける高速かつメモリ効率的な統計計算と多様な解析の統合を実現したことを報告しています。
本論文は、RNA-seq やプロテオミクスなどのバルクオミクスデータから、次元削減されたデータにおける分子トレンドと統計的・機能的情報を統合してインタラクティブに探索し、機能ドライバーや候補ターゲットを特定するための Web ツール「BioTrendFinder」を開発し、その有効性を示したものである。
この論文は、単一細胞クロマチンアクセシビリティから遺伝子発現を予測するための構成駆動型フレームワーク「SPEAR」を提案し、トランスフォーマーエンコーダーが最も高い予測性能を示すこと、予測可能性が遺伝子間で大きく異なり、シグナルは転写開始部位に近い領域に集中していることを実証しています。
本論文は、第二線抗結核薬の耐性予測における機械学習および深層学習モデルを包括的にベンチマークし、内部評価では従来の機械学習モデルが優位であったものの、外部検証では既存のカタログベース手法と同等の性能しか示さず、データセット間での汎化の課題を浮き彫りにした。
本論文は、限られた腫瘍マルチオミクスデータをパンがん単細胞リソースを活用して拡張・統合し、細胞間コミュニケーションに基づいた調節メカニズムを特定・優先順位付けする「IMAS」というターゲット意識型の統合フレームワークを提案し、大腸がんデータにおいてその有効性を示したものである。
本研究は、FreeSurfer などの高負荷ソフトウェアに依存せず、MNI 標準空間でアトラスに基づく PET 画像の定量的解析を可能にするオープンソースのデスクトップツール「BrainPET Studio」を開発し、既存の主要なパイプラインとの高い相関を確認してその信頼性とアクセシビリティを実証したものである。
VeloTrace は、ニューラル常微分方程式(Neural ODE)を用いて RNA スプライシング速度と細胞軌跡推論を統合し、局所的な速度ベクトルと大域的な軌跡の幾何学的連続性を保証することで、シーケンシング深度が不十分な遺伝子を含む全遺伝子の転写動態を高精度に再構築する新しい単一細胞トランスクリプトミクス解析フレームワークです。
本研究では、異なるデジタル PCR 機器間のデータ互換性と比較可能性を向上させるため、実験メタデータ、アッセイ情報、蛍光強度データを含む軽量な標準フォーマット「デジタル PCR データエッセンシャルズ標準(DDES)」を提案し、これにより FAIR データ原則の達成や研究の再現性向上、将来のデータリポジトリ構築の基盤を確立することを目的としています。
DyME は、高スループット変異導入と分子動力学シミュレーションを統合し、数千の分子システムの準備から解析までを自動化する分散プラットフォームであり、タンパク質認識の模倣やエンジニアリングを可能にする。
本論文は、AlphaFold を用いてミトコンドリア融合タンパク質ミトフュシン類のフル-length 構造モデルを構築し、ヘプタッドリピートドメインを介した新規なクロス型ダイマー化様式とオリゴマー化のメカニズムを解明した。