バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Teaching Diffusion Models Physics: Reinforcement Learning for Physically Valid Diffusion-Based Docking

この論文は、強化学習を用いて拡散モデルベースの分子ドッキング手法を物理的制約やタンパク質 - リガンド相互作用に適合するように微調整することで、推論時の計算コストを増やすことなく物理的に妥当な構造の生成率と精度を向上させ、特にトレーニングデータと類似度の低いターゲットにおいて既存手法を上回る性能を達成したことを示しています。

Broster, J. H., Popovic, B., Kondinskaia, D., Deane, C. M., Imrie, F.2026-03-27💻 bioinformatics

Horse, not zebra: accounting for lineage abundance in maximum likelihood phylogenetics

この論文では、病原体の系統発生推定において、希少な系統よりも共通の系統(「馬」)を優先する「馬とシマウマ」の原則を取り入れた 2 つの最大尤度法アプローチ(多分岐の再スケーリングと系統発生事前分布の導入)を提案し、SARS-CoV-2 のような大規模な多分岐が発生するシナリオにおいて推定精度を劇的に向上させることを示しています。

De Maio, N.2026-03-27💻 bioinformatics

Amaranth: Enhanced Single-Cell Transcript Assembly via Discriminative Modeling of UMI Reads and Internal Reads

本論文は、UMI リードと内部リードの生物学的・統計的性質の違いを識別的にモデル化し、これに基づいて開発した新しいシングルセル転写アセンブラ「Amaranth」が、Smart-seq3 データセットにおいて既存の手法を上回る精度でアイソフォームレベルの転写再構成を実現することを報告しています。

Zang, X. C., Zahin, T., Khan, I. M., Shi, Q., Xing, Y., Shao, M.2026-03-26💻 bioinformatics

Predicting Unseen Gene Perturbation Response Using Graph Neural Networks with Biological Priors

本論文は、タンパク質間相互作用ネットワークや機能注釈などの生物学的知識をグラフニューラルネットワークに統合した「PerturbGraph」というフレームワークを提案し、訓練データに含まれていない遺伝子操作に対する転写応答を、既存の手法よりも高い精度で予測可能にしたことを報告しています。

Dip, S. A., Zhang, L.2026-03-26💻 bioinformatics

Nextstrain automates real-time phylodynamic analysis of open data for endemic and emerging pathogens

Nextstrain は、エンドミックおよび新興病原体の 21 種類について、オープンデータのみを用いて日次で自動化されたリアルタイムな系統動態分析を実施し、その結果を公開するプラットフォームを提供するものである。

Andrews, K. R., Chang, J., Roemer, C., Hadfield, J., Lin, V., Brito, A. F., Daodu, R., Joia, I. A., Kistler, K., Li, A. W., Moncla, L. H., Paredes, M. I., Kuhnert, D., Torres, L. M., Voitl, L., Aksame (…)2026-03-26💻 bioinformatics

FoundedPBI: Using Genomic Foundation Models to predict Phage-Bacterium Interactions

本論文は、プロカリアートとバクテリオファージの両方のゲノムで事前学習された大規模言語モデルのアンサンブル学習と長文脈処理技術を組み合わせることで、実験的スクリーニングに依存せず、DNA 配列のみからファージと細菌の相互作用を高精度に予測する新しい手法「FoundedPBI」を提案し、既存の最先端手法を上回る性能を達成したことを報告しています。

Carrillo Barrera, P., Babey, A., Pena, C. A.2026-03-26💻 bioinformatics

Is metabolism spatially optimized? Structural modeling of consecutive enzyme pairs reveals no evidence for spatial optimization of catalytic site proximity.

本研究は、AlphaFold2 などの構造予測手法を用いて大腸菌の連続する酵素対を解析した結果、酵素間の相互作用は確認されるものの、触媒部位の距離が代謝効率向上のために構造的に最適化されているという証拠は見つからなかったと結論付けています。

Algorta, J., Walther, D.2026-03-26💻 bioinformatics

Self-supervised learning for a gene program-centric view of cell states

本研究は、単一細胞オミクスデータから遺伝子プログラム(GP)に焦点を当てた解釈可能な表現を学習する自己教師ありトランスフォーマーモデル「Tripso」を提案し、造血幹細胞の培養維持改善やアトピー性皮膚炎における未同定の免疫遺伝子プログラムの発見など、生物学的に意味のある仮説生成と実用的な発見を可能にすることを示しています。

Moullet, M., Isobe, T., Vahidi, A., Leonardi, C., Paulas-Condori, L., Soelistyo, C., Steele, L., Ly, K. C. H., Quiroga Londono, M., Mende, N., Stephenson, E., Iskander, D., Webb, S., Goh, I., Vijayaba (…)2026-03-26💻 bioinformatics

Chromatix: a differentiable, GPU-accelerated wave-optics library

この論文は、計算光学におけるシミュレーションの標準化と高速化を目的として、JAX に基づき GPU 並列処理と微分可能性を備えたオープンソースの波動光学ライブラリ「Chromatix」を提案し、その有効性を複数の光学応用例で実証したものである。

Deb, D., Both, G.-J., Bezzam, E., Kohli, A., Yang, S., Chaware, A., Allier, C., Cai, C., Anderberg, G., Eybposh, M. H., Schneider, M. C., Heintzmann, R., Rivera-Sanchez, F. A., Simmerer, C., Meng, G. (…)2026-03-25💻 bioinformatics