バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Identification of Distinct Topological Structures From High-Dimensional Data

この論文は、高次元の単一細胞 RNA シーケンシングデータから、細胞分化や外部刺激への応答、遺伝子ノックアウトの影響など、複数の生物学的プロセスを同時に解きほぐすために、低次元パラメータ化と有限摂動を用いて従来の手法では見逃されがちな特異的なトポロジー構造を同定する新しい手法「ID」を提案し、その有効性を示したものである。

Xu, B., Braun, R.2026-03-23💻 bioinformatics

Single-cell spatial multi-omics molecular pathology enabled by SuperFocus

本論文は、既存の手法に比べて精度を大幅に向上させ、組織形態学とゲノム規模の分子プロファイリングを統合したスケーラブルな単一細胞空間マルチオミクス解析を実現する計算プラットフォーム「SuperFocus」を提案し、次世代分子病理学への架け橋となることを示しています。

Lu, Y., Tian, X., Vicari, M., Enninful, A., Bao, S., Bai, Z., Liu, C., Zhang, X., Andren, P., Lundeberg, J., Xu, M. L., Fan, R., Xiao, Y., Ma, Z.2026-03-23💻 bioinformatics

Breaking the Extraction Bottleneck: A Single AI Agent Achieves Statistical Equivalence with Human-Extracted Meta-Analysis Data Across Five Agricultural Datasets

この論文は、5 つの農業データセットにおけるメタ分析データ抽出において、単一の AI エージェントが統計的に人間による抽出と同等の精度を達成し、従来の抽出プロセスのボトルネックを解消する有効性を示したものである。

Halpern, M.2026-03-23💻 bioinformatics

FuzzyClusTeR: a web server for analysis of tandem and diffuse DNA repeat clusters with application to telomeric-like repeats

本論文は、タンデム反復配列だけでなく、完全な配列を形成しない拡散的なDNA反復クラスターも検出・可視化・統計解析できるウェブサーバー「FuzzyClusTeR」を開発し、T2T-CHM13v2.0 ゲノムにおけるテロメア様反復配列の拡散クラスターが非ランダムなパターンとして存在することを示したものである。

Aksenova, A. Y., Zhuk, A. S., Lada, A. G., Sergeev, A. V., Volkov, K. V., Batagov, A.2026-03-23💻 bioinformatics

Solving the Diagnostic Odyssey with Synthetic Phenotype Data

この論文は、構造化されたオントロジーと経験的な事前分布を活用して現実的な合成表現型データを生成するフレームワーク「GraPhens」を開発し、これを用いて合成データのみで学習したグラフニューラルネットワーク「GenPhenia」が、実世界の臨床データに対しても既存手法を上回る遺伝子優先順位付けの性能を発揮することを示しています。

Colangelo, G., Marti, M.2026-03-23💻 bioinformatics

Learning gene interactions from tabular gene expression data using Graph Neural Networks

本論文は、TCGA コホートの 7 種類のがんデータを用いて、bulk 遺伝子発現データから潜在する遺伝子相互作用ネットワークを同時に学習し患者の予後を予測する GNN ベースのフレームワーク「REGEN」を提案し、ネットワーク構築の指針を確立するとともに生物学的妥当性を検証したものである。

Boulougouri, M., Nallapareddy, M. V., Vandergheynst, P.2026-03-23💻 bioinformatics

A harmonized benchmarking framework for implementation-aware evaluation of 46 polygenic risk score tools across binary and continuous phenotypes

本論文は、統計的仮定や実装の複雑さにより比較が困難だった46 種類の多遺伝子リスクスコア(PRS)ツールについて、英国バイオバンクのデータを用いた統一的なベンチマークフレームワークを開発し、予測性能だけでなく実行時間やリソース使用量などの実装上の制約も評価することで、ツール間の性能差が統計的手法だけでなく表現型の構造や実用的な制約にも依存することを明らかにしました。

Muneeb, M., Ascher, D.2026-03-23💻 bioinformatics