バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Temporal AI model predicts drivers of cell state trajectories across human aging

本研究では、ヒトの生涯にわたる細胞状態の軌跡を学習した時系列 AI モデル「MaxToki」を開発し、加齢に伴う細胞変化の予測や、実験的に検証された新たな加齢調節ターゲットの発見を通じて、治療的介入の創出を加速する可能性を示しました。

Gomez Ortega, J., Nadadur, R. D., Kunitomi, A., Kothen-Hill, S., Wagner, J. U. G., Kurtoglu, S. D., Kim, B., Reid, M. M., Lu, T., Washizu, K., Zanders, L., Chen, H., Zhang, Y., Ancheta, S., Lichtarge (…)2026-04-01💻 bioinformatics

emb2dis: a novel protein disorder prediction tool based on ResNets, dilated convolutions & protein language models

本論文は、タンパク質言語モデルと残差ネットワーク、拡張畳み込みを組み合わせた新しい深層学習モデル「emb2dis」を提案し、CAID3 ベンチマークで Disorder-PDB カテゴリにおいて第 1 位となる高い精度でタンパク質の内在性無秩序領域を予測できることを示しています。

Duarte, S. A., Mehdiabadi, M., Bugnon, L. A., Aspromonte, M. C., Piovesan, D., Milone, D. H., Tosatto, S., Stegmayer, G.2026-04-01💻 bioinformatics

The PhageExpressionAtlas reveals shared and unique transcriptional patterns across phage-host interactions

本論文は、ファージ感染の時間分解二重 RNA シーケンシングデータを統一されたパイプラインで処理・保存し、可視化を通じてファージと宿主の相互作用における転写パターンや防御システムの動態を包括的に解析できる初のバイオインフォマティクス資源「PhageExpressionAtlas」を構築し、ファージ宿主研究の民主化と統合的評価を支援するものである。

Wolfram-Schauerte, M., Trust, C., Waffenschmidt, N., Nieselt, K.2026-04-01💻 bioinformatics

VicMAG, an open-source tool for visualizing circular metagenome-assembled genomes highlighting bacterial virulence and antimicrobial resistance

この論文は、パシフィック・バイオサイエンスの HiFi シーケンシング技術を用いて得られた複雑なメタゲノムアセンブリから円形メタゲノムアセンブリ(cMAGs)を可視化し、細菌の病原性や薬剤耐性に関わる遺伝子の分布と文脈を包括的に理解するためのオープンソースツール「VicMAG」を開発し、その有用性を示したものである。

Tsuda, Y., Tanizawa, Y., Vu, T. M. H., Nishimura, Y., Shintani, M., Abe, H., Hasebe, F., Kasuga, I., Nagao, M., Suzuki, M.2026-04-01💻 bioinformatics

ProteoPy: an AnnData-based framework for integrated proteomics analysis

ProteoPy は、AnnData 構造を中核とし、COPF アルゴリズムの再実装を通じてペプチドレベルのデータからプロテオフォーム群を推論できる軽量な Python ライブラリであり、プロテオミクス解析の効率化とスキャンピやムオン生態系との統合によるマルチオミクス解析の基盤を提供するものである。

Fichtner, I. D., Temesvari-Nagy, L., Sahm, F., Gerstung, M., Bludau, I.2026-04-01💻 bioinformatics

Protein Language Models Outperform BLAST for Evolutionarily Distant Enzymes: A Systematic Benchmark of EC Number Prediction

本論文は、酵素分類番号(EC 番号)の予測において、進化距離が遠い酵素に対して BLAST よりも大幅に高性能であり、かつ単純な MLP 分類機と ESM2-650M の組み合わせが最も効果的であることを示す体系的なベンチマーク研究を報告しています。

Sathyamoorthy, R., Puri, M.2026-04-01💻 bioinformatics

Baktfold: Sensitive protein functional annotation across the microbial tree of life using structural information

Baktfold は、ProstT5 と Foldseek を活用してタンパク質構造情報を基に微生物のゲノムを高速かつ高感度に機能注釈する新たなコマンドラインツールであり、従来の手法よりもはるかに多くの仮説タンパク質の機能を解明できることを示しています。

Bouras, G., Lim, S. w., Durr, L., Vreugde, S., Goesmann, A., Edwards, R. A., Schwengers, O.2026-04-01💻 bioinformatics

Protein sequence domain annotation using a language model

本論文は、事前学習されたタンパク質言語モデル(ESM-2)と構造確率デコーダを組み合わせた「PSALM」という手法を提案し、従来の HMMER と同等の感度・特異度 tradeoff を達成しつつ、特に緩和された閾値条件下で UniProtKB におけるドメインアノテーションのカバレッジを向上させることを示しています。

Sarkar, A., Krishnan, K., Eddy, S. R.2026-03-31💻 bioinformatics

Amino acid substitutomics: profiling amino acid substitutions at proteomic scale unveils biological implication and escape mechanism in cancer

本研究では、新規質量分析解析ツール PIPI-C を用いてがんのタンパク質レベルでのアミノ酸置換を網羅的にプロファイリングする「アミノ酸置換オミクス」を提案し、ゲノムやトランスクリプトームでは検出されない多数の新たな置換を同定するとともに、がんの生物学的意義や薬剤耐性・免疫逃避のメカニズムの解明に貢献する堅牢な枠組みを確立しました。

Zhao, P., DAI, S., Lai, S., Zhou, C., Li, N., Yu, W.2026-03-31💻 bioinformatics