バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

MAAMOUL: Metabolic network-based discovery of microbiome-metabolome shifts in disease

この論文は、メタゲノムデータとメタボロームデータを統合し、既知の代謝ネットワークを活用して疾患特異的な微生物代謝モジュールを同定する計算フレームワーク「MAAMOUL」を提案し、炎症性腸疾患や過敏性腸症候群において従来の手法では見逃されていた機能的な変化を明らかにしたことを報告しています。

Muller, E., Baum, S., Borenstein, E.2026-03-30💻 bioinformatics

DualLoc: Full-parameter fine-tuning of cascaded dual transformers for protein subcellular localization prediction

本研究は、タンパク質の多重的な細胞内局在を高精度に予測するために、カスケード型デュアル・トランスフォーマー構造を用いたフルパラメータ微調整モデル「DualLoc」を開発し、既存手法を上回る性能と生物学的に妥当な細胞区画間の相関を明らかにしたことを報告しています。

Chen, Y. G., Chung, W.-Y., Chang, K. Y.2026-03-30💻 bioinformatics

Pan-Pharmacological Drug-Target Interaction Prediction with 3D-Informed Protein Encoding at Scale

BindingDB の 200 万組以上の化合物 - タンパク質対で学習されたマルチタスクフレームワーク「OmniBind」は、タンパク質の立体構造をトークン列として符号化する革新的な手法により、複数の薬理学的エンドポイントを同時に高精度に予測し、創薬リード最適化や安全性評価、ドラッグリポジショニングに貢献する。

Kawaharada, A., Ito, T., Shimizu, H.2026-03-30💻 bioinformatics

Clinical evidence yield as a framework for evaluating computational predictors and multiplexed assays of variant effect

この論文は、変異影響予測ツールやマルチプレックスアッセイの臨床的有用性を従来の識別指標ではなく、ACMG/AMP ガイドラインに基づく「平均証拠強度(MES)」という新たな定量的指標を用いて評価する枠組みを提案し、MAVEs や CPT-1 などの手法が VUS(意義不明変異)の解釈において高い臨床証拠を提供できることを示しています。

Shang, Y., Badonyi, M., Marsh, J. A.2026-03-30💻 bioinformatics

FoldaVirus, a knowledge-based icosahedral capsid builder using AlphaFold

この論文は、AlphaFold による単一タンパク質の構造予測と既知のウイルス家族の知識を組み合わせ、Amber によるエネルギー最小化と統計的検証を経て、T=9 までの多様な正二十面体カプシド構造を構築する汎用的な手法「FoldaVirus」を開発し、配列と構造の間の巨大なギャップを埋めたことを報告しています。

Rojas Labra, O., Montoya-Munoz, D. S., Santoyo-Rivera, N., McDonald, J., Montiel-Garcia, D., Case, D. A., Reddy, V. S.2026-03-30💻 bioinformatics

ALPINE: A Scalable Pipeline for Comprehensive Classification of Gene-Editing Outcomes from Long-Read Amplicon Sequencing

CRISPR 遺伝子編集の長リードアンプリコンシーケンシングデータから、ベクター統合や構造変異を含む多様な編集結果を包括的に分類・定量化するスケーラブルなパイプライン「ALPINE」を開発し、その高精度と臨床応用への有用性を示しました。

Chen, Y., Gao, X.-H., Vichas, A., Wang, J., Golhar, R., Neuhaus, I.2026-03-30💻 bioinformatics

Deciphering sepsis molecular subtypes using large-scale data to identify subtype-specific drug repurposing

本論文は、大規模な転写組データを用いて敗血症を免疫および代謝特性に基づき 4 つの分子サブタイプに分類し、各サブタイプに特異的な遺伝子シグネチャを同定することで、メチレンブルーやモノクローナル抗体など、従来の臨床試験の失敗要因を説明しつつ個別化医療を実現する可能性のある薬剤転用候補を特定したことを示しています。

Smith, L. A., Augustin, B., Jacob, V., Black, L. P., Bertrand, A., Hopson, C., Cagmat, E., Datta, S., Reddy, S., Guirgis, F., Graim, K.2026-03-30💻 bioinformatics

The End of Aging Clocks: Training Foundation Models to Reason in Aging and Longevity

本研究は、DNA メチル化やプロテオミクスなどの多様な生体データを学習した大規模言語モデル「Longevity-LLM v0.1」を開発し、従来の専門的な老化時計モデルを単一のモデルで凌駕する性能と多様なタスク実行能力を実証したものです。

Zhavoronkov, A., Aladinskyi, V., Aliper, A., Miftakhutdinov, Z., Reymond, M., Naumov, V., Zagirova, D., Pushkov, S., Sidorenko, D., Shayakhmetov, R., Galkin, F.2026-03-30💻 bioinformatics

SpacerScope: Binary-vectorized, genome-wide off-target profiling for RNA-guided nucleases without prior candidate-site bias

SpacerScope は、バイナリ・ベクトル化と高速なビット演算を活用して、従来のツールでは見逃されがちだった挿入・欠損を含む非標準的なアラインメントも網羅的に検出できる、高精度かつ高速な CRISPR 脱標的解析フレームワークとして開発されました。

Qu, Y., Wang, Y., Yan, W., Tang, H., Chen, Q.2026-03-30💻 bioinformatics