バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Universal physical principles govern the deterministic genesis of protein structure

本研究は、アミノ酸の凝縮から機能的タンパク質の出現までの過程を支配する「組み立て」「創発」「相転移」という 3 つの普遍的物理原理を特定し、深層学習モデルのブラックボックスを解明する統一的な数学的枠組み「ProtGenesis」を提案することで、タンパク質構造の生成が決定論的な物理過程であることを明らかにした。

Chuanyang, L., Liu, J., Qiu, X., Wu, X., Li, W., Min, L., Zhang, G., Zhang, S., Zhu, L.2026-02-23💻 bioinformatics

SPrOUT: A computational and targeted sequencing approach for mixed plant DNA identification with Angiosperms353

本論文は、Angiosperms353 ターゲット配列シーケンシングと HybPiper によるアセンブリを活用し、混合植物サンプルから種を高精度に同定するための新しい計算機・実験的アプローチ「SPrOUT」を提案し、その有効性を示したものである。

Hu, N., Bullock, M. R., Jackson, C., Miller, C., Hunter, E., Huff, C., Chen, Y., Handy, S., Johnson, M.2026-02-23💻 bioinformatics

Comprehensive top-down mass spectral repository enables pan-dataset analysis and top-down spectral prediction

本研究は、12 種 8 種類の質量分析計から得られた 1,800 万枚以上のスペクトルを含む包括的なトップダウン質量分析スペクトルリポジトリ「TopRepo」を構築し、タンパク質プロteoform の網羅的解析や深層学習モデルを用いた高精度なスペクトル予測を可能にしたことを報告しています。

Li, K., Liu, K., Fulcher, J. M., Tang, H., Liu, X.2026-02-23💻 bioinformatics

CellAwareGNN: Single-Cell Enhanced Knowledge Graph Foundation Model for Drug Indication Prediction

この論文は、単一細胞ゲノミクスデータを統合して構築した新しい知識グラフ「scPrimeKG」およびその上で学習されたモデル「CellAwareGNN」を提案し、既存のモデルと比較して自己免疫疾患を含む全疾患に対する薬剤適応症予測の精度と生物学的解釈性を大幅に向上させたことを示しています。

Zhang, X., Jeong, E., Yan, C., Feng, Y., Lyu, L., Guo, X., Chen, Y.2026-02-23💻 bioinformatics

Inference of cancer driver mutations from tumor microenvironmentcomposition: a pan-cancer study with cross-platform external validation

本論文は、がんの微小環境(TME)の構成成分から機械学習を用いてドライバー変異を予測する手法を開発し、TCGA などの大規模データセットおよび独立した外部コホートにおける汎がん研究とクロスプラットフォーム検証を通じて、TME の組成ががんドライバー変異を推論する上で十分な情報を含んでいることを実証したものである。

Baker, E. A., Mehaffy, N. S.2026-02-23💻 bioinformatics

MetaTracer: A nucleotide alignment-based framework for high-resolution taxonomic and transcript assignment in metatranscriptomic data

メタトランスクリプトミクスデータにおける複雑な細菌群集の解析向けに、配列リードを単一パスで分類群と発現遺伝子の両方に高精度に割り当てるナノチドアラインメントベースのフレームワーク「MetaTracer」が開発され、シミュレーションおよび実データ(歯垢)を用いた検証でその有効性が示されました。

Furstenau, T., Shaffer, I., Hsu, K.-L. C., Pearson, T., Ernst, R. K., Fofanov, V.2026-02-23💻 bioinformatics

What makes a banana false? How the genome of Ethiopian orphan staple Ensete ventricosum differs from the banana A and B sub-genomes

エチオピアの重要作物であるエナセ(Ensete ventricosum)の Mazia 品種のゲノムを新規に解読し、バナナとの比較を通じてエナセに特有の遺伝子群や機能的特徴を明らかにすることで、同作物の育種改善に向けた基盤を構築しました。

Muzemil, S., Paul, P., Baxter, L., Dominguez-Ferreras, A., Sahu, S. K., Van Deynze, A., Mai, G., Yemataw, Z., Tesfaye, K., Ntoukakis, V., Studholme, D. J., Grant, M.2026-02-23💻 bioinformatics

Hierarchical Multi-Omics Trajectory Prediction forFecal Microbiota Transplantation: A Novel MachineLearning Framework for Small-Sample LongitudinalMulti-Omics Integration

本研究は、再発性クロストリジオイデス・ディフィシル感染症に対する糞便微生物移植(FMT)の個人別治療反応を予測し、生物学的解釈性を維持しながら少量の縦断的マルチオミクスデータを統合するための新たな機械学習フレームワーク「HMOTP」を提案し、その有効性を検証したものである。

Zhou, Y.-H., Sun, G.2026-02-23💻 bioinformatics

Interpretable transcriptome-to-phenotype modeling of cell-painting nuclear morphology features from RNA-seq under low-dose radiation exposure

本論文は、低線量放射線被曝下での時間的変化を捉えるために、RNA シーケンシングデータと細胞ペインティング画像から得られた核形態特徴を結びつける解釈可能な逆モデルを開発し、放射線被曝による核形態の変化に関連する安定した転写産物予測因子を同定する手法を提案しています。

Jantre, S., Chopra, K., Zhao, G., Cucinell, C., Weinberg, R., Forrester, S., Brettin, T., Urban, N. M., Qian, X., Yoon, B.-J.2026-02-23💻 bioinformatics