バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

PhosSight: a Unified Deep Learning Framework Boosting and Accelerating Phosphoproteome Identification to Enable Biological Discoveries

本論文は、DDA および DIA モードにおけるリン酸化プロテオーム解析の課題を解決し、生物学的発見を加速するための深層学習フレームワーク「PhosSight」を開発し、その UCEC コホートへの適用により新たな予後関連キナーゼ標的の発見を可能にしたことを報告しています。

Wang, B., Cheng, Z., She, C., Zhang, J., Lv, L., Zhu, H., Liu, L., Fu, Y., Yi, X.2026-03-10💻 bioinformatics

Developing SCL2205 : A Protein Sequence-based Spatial Modelling Dataset for the Protein Language Model Frontier

本論文は、高品質な前処理と厳格なデータ分割により既存の手法におけるデータリークや性能過大評価の問題を解決し、タンパク質の細胞内局在予測のための深層学習モデルの発展を支援する新しいデータセット「SCL2205」を開発・公開したことを報告しています。

Ouso, D., Pollastri, G.2026-03-10💻 bioinformatics

Phosphorylation of a tumor-derived ASXL2 epitope remodels 1 peptide-HLA binding affinity and interaction dynamics

本研究は、がん細胞に特異的な ASXL2 由来のリン酸化エピトープが、結合親和性の向上と pHLA 複合体の構造ダイナミクスの変化をもたらすことで、がん免疫療法の新たな標的となり得ることを、分子動力学シミュレーションを通じて解明したものである。

Zhang, J., Lv, L., Chen, B., Yi, X.2026-03-10💻 bioinformatics

STAR Suite: Integrating transcriptomics through AI software engineering in the NIH MorPhiC consortium

本論文は、中間ファイルの生成を不要とし、AI 支援と人工的なエンジニアリングを組み合わせることで STAR アライナーの機能を C++ ソースコードに直接統合した「STAR Suite」を開発し、NIH MorPhiC コンソーシアムにおけるトランスクリプトミクスデータ処理の効率化とスケーラビリティを飛躍的に向上させたことを報告しています。

Hung, L.-H., Yeung, K. Y.2026-03-10💻 bioinformatics

Ensemble-based genomic prediction for maize flowering-time improves prediction accuracy and reveals novel insights into trait genetic variation

この論文は、複数の個別のゲノム予測モデルを統合するアンサンブル手法(EasiGP パイプライン)が、トウモロコシの開花時期形質の予測精度を向上させ、遺伝的変異の多面的な理解を通じて育種応用の可能性を広げることを実証しています。

Tomura, S., Powell, O. M., Wilkinson, M. J., Cooper, M.2026-03-09💻 bioinformatics

ChatSpatial: Schema-Enforced Agentic Orchestration for Reproducible and Cross-Platform Spatial Transcriptomics

本論文は、Python と R の異なる生態系にまたがる 60 以上の手法を統合し、LLM が自由なコード生成ではなく事前検証されたスキーマに基づいてツールを選択する「ChatSpatial」を提案することで、空間トランスクリプトミクス解析における再現性とクロスプラットフォーム対応を可能にしたことを報告しています。

Yang, C., Zhang, X., Chen, J.2026-03-09💻 bioinformatics

Benchmarking tissue- and cell type-of-origin deconvolution in cell-free transcriptomics

本研究は、血漿中の細胞フリー RNA(cfRNA)の組織および細胞起源の推定を行うためのデコンボリューション手法を体系的にベンチマークし、手法や参照データの違いが結果に大きな影響を与えること、特に組織レベルの推定は細胞レベルの推定よりも頑健であることを明らかにしました。

Ioannou, A., Friman, E. T., Daub, C. O., Bickmore, W. A., Biddie, S. C.2026-03-09💻 bioinformatics

Fractal: Towards FAIR bioimage analysis at scale with OME-Zarr-native workflows

本論文は、大規模な生体画像データの FAIR 化とスケーラブルな解析を実現するため、OM E-Zarr 形式に特化した処理単位を定義する「Fractal タスク仕様」と、それを活用する「Fractal プラットフォーム」の 2 つの貢献を紹介し、臨床現場での高い再現性を有する大規模細胞定量解析の成功例を示しています。

Lüthi, J., Cerrone, L., Comparin, T., Hess, M., Hornbachner, R., Tschan, A., Glasner de Medeiros, G. Q., Repina, N. A., Cantoni, L. K., Steffen, F. D., Bourquin, J.-P., Liberali, P., Pelkmans, L., Uh (…)2026-03-09💻 bioinformatics

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

この論文は、openSNP データセットから抽出された 80 の二値表現型を用いて、機械学習・深層学習アルゴリズムと多遺伝子リスクスコアツールをベンチマークし、表現型によってそれぞれが異なる性能を発揮することを明らかにしたものである。

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics