バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

A ML-framework for the discovery of next-generation IBD targets using a harmonized single-cell atlas of patient tissue

この論文は、統合化された単一細胞アトラスと機械学習フレームワーク(IPR)を活用して、炎症性腸疾患(IBD)の新たな細胞特異的治療ターゲットを同定し、実験的に検証する包括的な手法を提案しています。

Joglekar, A., Joseph, A., Honsa, P., Ruppova, K., Pizzarella, V., Honan, A., Mediratta, D., Vollmer, E., Geller, E., Valny, M., Macuchova, E., Zheng, S., Greenberg, A., Taus, P., Kline-Schoder, A., Ko (…)2026-02-16💻 bioinformatics

Learning fragment-based segmentation of binding sites from molecular dynamics: a proof-of-concept on cardiac myosin.

本論文は、タンパク質結合部位の動的変化を捉えるために、分子動力学シミュレーションから学習した深層学習モデル「FragBEST-Myo」を開発し、心筋ミオシンの結合部位におけるフラグメントベースのセグメンテーションとアンサンブルドッキングへの応用可能性を実証したものである。

Yang, Y.-Y., Pickersgill, R. W., Fornili, A.2026-02-16💻 bioinformatics

Benchmarking within-sample minority variant detection with short-read sequencing in M. tuberculosis

この論文は、7 種類のバリアント・コーラーをシミュレーションデータで比較評価した結果、FreeBayes が最も高精度であったことを示し、さらにその出力をフィルタリングするための新しいエラーモデルを開発して偽陽性を大幅に削減するベストプラクティスを提案しています。

Mulaudzi, S., Kulkarni, S., Marin, M. G., Farhat, M. R.2026-02-16💻 bioinformatics

Accurate Macromolecular Complex Modeling for Cryo-EM with CryoZeta

本論文は、拡散モデルに基づく生成深層ニューラルネットワークを活用し、配列情報とクライオ電子顕微鏡の密度マップを統合することで、非原子分解能のデータからも高精度な生体分子複合体の構造モデルを構築する新しい手法「CryoZeta」を提案し、既存の手法を上回る性能を実証したものである。

Zhang, Z., Li, S., Farheen, F., Kagaya, Y., Liu, B., Ibtehaz, N., Terashi, G., Nakamura, T., Zhu, H., Khan, K., Zhang, Y., Kihara, D.2026-02-16💻 bioinformatics

IntelliFold-2: Surpassing AlphaFold 3 via Architectural Refinement and Structural Consistency

IntelliFold-2 は、アーキテクチャの洗練と多スケール構造的一貫性を導入することで AlphaFold 3 を凌駕する精度と堅牢性を実現し、抗体 - 抗原相互作用やタンパク質 - リガンド共フォールディングにおいて特に優れた性能を示すオープンソースの生体分子構造予測モデルです。

Qiao, L., Yan, H., Liu, G., Guo, G., Sun, S.2026-02-14💻 bioinformatics

MassID provides near complete annotation of metabolomics data with identification probabilities

MassID は、深層学習に基づくピーク検出と新規モジュール DecoID2 を活用して偽発見率を制御した確率的な代謝物同定を可能にするクラウド型メタボロミクス解析パイプラインであり、ヒト血漿データにおいて従来の基準を超える高い同定精度と網羅性を達成したことを示しています。

Stancliffe, E., Gandhi, M., Guzior, D. V., Mehta, A., Acharya, S., Richardson, A. D., Cho, K., Cohen, T., Patti, G. J.2026-02-14💻 bioinformatics

Cell phenotypes in the biomedical literature: a systematic analysis and text mining corpus

本論文は、単一細胞技術によって同定された細胞表現型の知識を体系化し、Cell Ontology と連携した大規模な注釈コーパス「CellLink」を構築・分析することで、細胞名の命名パターンを解明し、自然言語処理モデルの性能向上やオントロジーの拡張に貢献する手法を提案しています。

Rotenberg, N. H., Leaman, R., Islamaj, R., Kuivaniemi, H., Tromp, G., Fluharty, B., Richardson, S., Eastwood, C., Diller, M., Xu, B., Pankajam, A. V., Osumi-Sutherland, D., Lu, Z., Scheuermann, R. H.2026-02-14💻 bioinformatics