バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Structure-aware geometric graph learning for modeling protease-substrate specificity at scale

本論文は、5 万 7 千以上の構造情報を含むプロテアーゼ - 基質ペアを用いて、空間的制約や高次関係を統合的に捉える幾何学的グラフ学習フレームワーク「OmniCleave」を開発し、既存手法を上回る精度でプロテアーゼの基質特異性を大規模にモデル化するとともに、新たな基質や切断部位の発見を通じてその生物学的妥当性を実証したものである。

Guo, X., Bi, Y., Ran, Z., Pan, T., Sun, H., Hao, Y., Jia, R., Wang, C., Zhang, Q., Kurgan, L., Song, J., Li, F.2026-04-10💻 bioinformatics

A computational model for quantifying instability of tandem repeats across the genome

本論文は、ロングリードシーケンシングデータを用いてゲノム全体のタンデムリピート不安定性を定量化する計算モデルを提案し、リピート配列の組成が不安定性に大きく寄与することや、既知の疾患関連リピートにおいて顕著なモザイク変異を検出できることを示しています。

Dolzhenko, E., English, A., Mokveld, T., de Sena Brandine, G., Kronenberg, Z., Wright, G., Drogemoller, B., Rowell, W. J., Wenger, A. M., Bennett, M. F., Weisburd, B., Erwin, G. S., Jin, P., Nelson, D (…)2026-04-10💻 bioinformatics

BrightEyes-FFS: an open-source platform for comprehensive analysis of fluorescence fluctuation spectroscopy experiments with small detector arrays

この論文は、小型アレイ検出器を用いた蛍光揺らぎ分光法(FFS)の高次元データ解析を可能にする、オープンソースの Python ベースのプラットフォーム「BrightEyes-FFS」の開発とその機能(データ読み込み、相関計算、モデルフィッティング、GUI、Jupyter Notebook 連携など)を紹介し、分子動態や相互作用の研究を促進することを目的としています。

Slenders, E., Perego, E., Zappone, S., Vicidomini, G.2026-04-10💻 bioinformatics

Statistical Principles Define an Open-Source Differential Analysis Workflow for Mass Spectrometry Imaging Experiments with Complex Designs

この論文は、複雑な実験デザインを持つ質量分析イメージング研究において、信号処理や関心領域の選択、統計モデルの適切な活用を含むオープンソースの差分分析ワークフローを提案し、ヒトの骨関節炎サンプルとシミュレーションデータを用いてその有効性を検証したものである。

Rogers, E. B. T., Lakkimsetty, S. S., Bemis, K. A., Schurman, C. A., Angel, P. A., Schilling, B., Vitek, O.2026-04-10💻 bioinformatics

TopicVI: A Knowledge-guided deep interpretable model for resolving context-specific gene programs

この論文は、単一細胞および空間トランスクリプトミクスデータにおいて、既存の生物学的知識とデータ駆動型の最適輸送法を統合し、文脈に依存した遺伝子プログラムを解釈可能に発見する深層学習モデル「TopicVI」を提案し、その優れた性能とグリオブラストーマ解析における新たな生物学的知見の提供を実証したものである。

Cai, G., Zhao, W., Zhu, X., Lin, Y., Zhou, B., Cao, J., He, Q., Yang, B., Gu, X., Xiong, X., Zhou, Z.2026-04-10💻 bioinformatics

The Rayleigh Quotient and Contrastive Principal Component Analysis II

この論文は、空間 PCA のカーネル重み付けと基底関数係数空間における解法という 2 つの拡張を導入し、空間的および機能的な手法を統一的な枠組みで統合した対照主成分分析(cPCA)の新たな応用を、がんやワクチン接種への免疫反応に関するゲノムデータの分析例を通じて示しています。

Jackson, K. C., Carilli, M. T., Pachter, L.2026-04-10💻 bioinformatics

DIANA: Deep Learning Identification and Assessment of Ancient DNA

この論文は、参照データベースに依存せず、2,597 件のシーケンスデータで訓練された深層学習モデル「DIANA」を開発し、未知の分類群を含む古代メタゲノムサンプルの宿主や試料種などのメタデータを高精度に予測・検証可能にしたことを報告しています。

Duitama Gonzalez, C., Lopopolo, M., Nishimura, L., Faure, R., Duchene, S.2026-04-10💻 bioinformatics

Divergent landscapes of positive and negative selection signatures across residue-resolved human-virus protein-protein interaction interfaces

本研究は、ウイルス標的ヒトタンパク質の相互作用界面において、正の選択がクラスター化し負の選択が広範囲に分散するという空間的な選択圧の多様性を解明し、特に宿主内パートナーとウイルスの両方に結合する「ミミック標的」界面が適応進化の焦点となっていることを示しています。

Su, W.-C., Xia, Y.2026-04-10💻 bioinformatics

CoPhaser: generic modeling of biological cycles in scRNA-seq with context-dependent periodic manifolds

本論文は、単一細胞転写データから細胞周期や概日リズムなどの生物学的サイクルを細胞文脈に依存する周期的多様体としてモデル化し、細胞のアイデンティティとサイクルの相互作用を解明する汎用的かつ解釈可能なアルゴリズム「CoPhaser」を提案するものである。

Paychere, Y., Salati, A., Gobet, C., Naef, F.2026-04-09💻 bioinformatics

Dissecting the Black Box of AlphaFold in Protein-Protein Complex Assembly

本論文は、AlphaFold-Multimer および AlphaFold3 の内部メカニズムを解明する統合的解釈フレームワークを開発し、タンパク質複合体の形成が共進化ではなく単量体の幾何学的構造と界面の相補性によって支配されていることを示し、抗原 - 抗体複合体の予測精度向上には界面の構造可塑性と相互作用のモデル化が鍵であることを明らかにしました。

Li, S., Mu, Z., Yan, C.2026-04-09💻 bioinformatics