Identification of Distinct Topological Structures From High-Dimensional Data
この論文は、高次元の単一細胞 RNA シーケンシングデータから、細胞分化や外部刺激への応答、遺伝子ノックアウトの影響など、複数の生物学的プロセスを同時に解きほぐすために、低次元パラメータ化と有限摂動を用いて従来の手法では見逃されがちな特異的なトポロジー構造を同定する新しい手法「ID」を提案し、その有効性を示したものである。
1243 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、高次元の単一細胞 RNA シーケンシングデータから、細胞分化や外部刺激への応答、遺伝子ノックアウトの影響など、複数の生物学的プロセスを同時に解きほぐすために、低次元パラメータ化と有限摂動を用いて従来の手法では見逃されがちな特異的なトポロジー構造を同定する新しい手法「ID」を提案し、その有効性を示したものである。
本論文は、従来のベイズ推定法に比べて精度を維持しつつ計算速度を劇的に向上させ、SARS-CoV-2 ゲノムや肺癌細胞の系統樹再構築を可能にする新しい変分推論手法「VINE」を提案するものである。
本論文は、既存の手法に比べて精度を大幅に向上させ、組織形態学とゲノム規模の分子プロファイリングを統合したスケーラブルな単一細胞空間マルチオミクス解析を実現する計算プラットフォーム「SuperFocus」を提案し、次世代分子病理学への架け橋となることを示しています。
この論文は、5 つの農業データセットにおけるメタ分析データ抽出において、単一の AI エージェントが統計的に人間による抽出と同等の精度を達成し、従来の抽出プロセスのボトルネックを解消する有効性を示したものである。
本論文は、タンデム反復配列だけでなく、完全な配列を形成しない拡散的なDNA反復クラスターも検出・可視化・統計解析できるウェブサーバー「FuzzyClusTeR」を開発し、T2T-CHM13v2.0 ゲノムにおけるテロメア様反復配列の拡散クラスターが非ランダムなパターンとして存在することを示したものである。
この論文は、構造化されたオントロジーと経験的な事前分布を活用して現実的な合成表現型データを生成するフレームワーク「GraPhens」を開発し、これを用いて合成データのみで学習したグラフニューラルネットワーク「GenPhenia」が、実世界の臨床データに対しても既存手法を上回る遺伝子優先順位付けの性能を発揮することを示しています。
本論文は、TCGA コホートの 7 種類のがんデータを用いて、bulk 遺伝子発現データから潜在する遺伝子相互作用ネットワークを同時に学習し患者の予後を予測する GNN ベースのフレームワーク「REGEN」を提案し、ネットワーク構築の指針を確立するとともに生物学的妥当性を検証したものである。
本論文は、タンパク質の酸化脆弱性と変異の可否を構造的・化学的・機能的・進化的な観点から統合的に評価し、酸化耐性タンパク質の合理的設計を支援する計算フレームワーク「EvoMut」を開発したことを報告しています。
本論文は、統計的仮定や実装の複雑さにより比較が困難だった46 種類の多遺伝子リスクスコア(PRS)ツールについて、英国バイオバンクのデータを用いた統一的なベンチマークフレームワークを開発し、予測性能だけでなく実行時間やリソース使用量などの実装上の制約も評価することで、ツール間の性能差が統計的手法だけでなく表現型の構造や実用的な制約にも依存することを明らかにしました。
本論文は、SIMD 命令を活用したベクトル化アルゴリズムと有限状態機械を実装した Rust 製ライブラリ「Helicase」を提案し、既存の最速ライブラリを上回る速度で FASTA/Q 形式の高速パースとビットパックを実現することを示しています。