バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Neurotox: Deep learning decodes conserved hallmarks of neurotoxicity across venomous species

本研究で開発された深層学習フレームワーク「Neurotox」は、タンパク質配列から動物毒の神経毒性を高精度に予測し、特定の接触残基ではなく二次構造や受容体相互作用を形成する分散した配列特徴が神経毒性の保存された特徴であることを明らかにしました。

Bedraoui, A., El Mejjad, S., Enezari, S., El Hajji, F. Z., Galan, J., El Fatimy, R., Daouda, T.2026-03-10💻 bioinformatics

Counting strands in outer membrane beta-barrels

本論文は、構造的特徴を統合した高精度アルゴリズム「PolarBearal」を改良し、AlphaFold2 データベースから得られた 57 万 1,760 個の予測構造に対して 97% の精度で外膜βバレルのストランド数を自動付与することで、従来困難だった大規模な構造解析を可能にしたことを報告しています。

Lim, S., Nimmagadda, T., Khamis, A., Montezano, D., Feehan, R., Copeland, M., Slusky, J.2026-03-10💻 bioinformatics

PhosSight: a Unified Deep Learning Framework Boosting and Accelerating Phosphoproteome Identification to Enable Biological Discoveries

本論文は、DDA および DIA モードにおけるリン酸化プロテオーム解析の課題を解決し、生物学的発見を加速するための深層学習フレームワーク「PhosSight」を開発し、その UCEC コホートへの適用により新たな予後関連キナーゼ標的の発見を可能にしたことを報告しています。

Wang, B., Cheng, Z., She, C., Zhang, J., Lv, L., Zhu, H., Liu, L., Fu, Y., Yi, X.2026-03-10💻 bioinformatics

Inferring large networks with matrix factorisation to capture non-linear dependencies among genes using sparse single-cell profiles

本論文は、単細胞トランスクリプトームデータの欠損値補完と非線形依存性の推定を可能にする行列分解に基づくネットワーク推論手法「NIRD」を提案し、バッチ効果への頑健性や RNA 速度との統合による転写因子標的の高精度予測を実証しています。

Jha, I. P., Meshran, A. G., Kumar, V., Natarajan, K. N., KUMAR, V.2026-03-10💻 bioinformatics

Exploring per-base quality scores as a surrogate marker of cell-free DNA fragmentome

本論文は、次世代シーケンシングの技術的メタデータとして扱われてきた塩基ごとの品質スコアが、がん患者の血中遊離 DNA 断片化パターンを反映しており、アライメント不要で低コストながん検出バイオマーカーとして機能し得ることを実証したものである。

Volkov, H. H. V., Raitses-Gurevich, M., Grad, M., Shlayem, R., Leibowitz, D., Rubinek, T., Golan, T., Shomron, N.2026-03-10💻 bioinformatics

Developing SCL2205 : A Protein Sequence-based Spatial Modelling Dataset for the Protein Language Model Frontier

本論文は、高品質な前処理と厳格なデータ分割により既存の手法におけるデータリークや性能過大評価の問題を解決し、タンパク質の細胞内局在予測のための深層学習モデルの発展を支援する新しいデータセット「SCL2205」を開発・公開したことを報告しています。

Ouso, D., Pollastri, G.2026-03-10💻 bioinformatics

Intrinsic dataset features drive mutational effect prediction by protein language models

タンパク質言語モデルの突然変異効果予測性能はモデルのアーキテクチャや学習戦略ではなく、データセット固有の特性(サイト間の適応度変動パターンなど)によって主に決定され、多くの場合、単純なサイト平均適応度に基づく予測と同等かそれ以下の性能しか示さないことが示されました。

Vieira, L. C., Lin, S., Wilke, C. O.2026-03-10💻 bioinformatics

Phosphorylation of a tumor-derived ASXL2 epitope remodels 1 peptide-HLA binding affinity and interaction dynamics

本研究は、がん細胞に特異的な ASXL2 由来のリン酸化エピトープが、結合親和性の向上と pHLA 複合体の構造ダイナミクスの変化をもたらすことで、がん免疫療法の新たな標的となり得ることを、分子動力学シミュレーションを通じて解明したものである。

Zhang, J., Lv, L., Chen, B., Yi, X.2026-03-10💻 bioinformatics