バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

本研究は、ヒトの基盤モデル注釈を活用してマカク属の単細胞トランスクリプトーム・アトラスを構築し、創薬ターゲットの同定や毒性メカニズムの解明を支援することで、非ヒト霊長類実験の削減と精密化を促進する統合リソースを提供するものである。

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics

ProteinSage: From implicit learning to explicit structural constraints for efficient protein language modeling

本論文は、構造情報を明示的な制約として取り入れた事前学習フレームワーク「ProteinSage」を提案し、少ないデータと計算資源で構造に忠実なタンパク質表現を学習し、微生物ロドプシンの新規同型体発見などにおいて優れた性能を示すことを実証しています。

Shen, L., Chao, L., Liu, T., Liu, Q., Zhou, G., Wang, H., Dong, X., Li, T., Zhang, X., Ni, J.2026-03-19💻 bioinformatics

High Resolution Solvated Models Reveal Mechanisms of Allosteric Activation of mTORC1 by RHEB

本研究は、AlphaFold-3 と分子動力学シミュレーションを統合した高解像度モデルを用いて、RHEB 結合が mTORC1 複合体の構造再編成を誘導し、ATP 結合を安定化させることで触媒活性に備えたアロステリックな前配列を引き起こす分子機構を解明した。

Ghosh, P., Maity, A., Kutti, V. R., Venkatramani, R.2026-03-19💻 bioinformatics

evedesign: accessible biosequence design with a unified framework

本論文は、機械学習を用いたタンパク質設計の非専門家の利用障壁を解消し、多目的最適化や実験との反復的連携を可能にする統合型オープンソースフレームワーク「evedesign」を提案し、抗体や酵素の設計・発見におけるその有用性を実証したものである。

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

GAP-MS: Automated validation of gene predictions using integrated mass ‎spectrometry evidence

この論文は、タンパク質質量分析データを統合的に活用して遺伝子予測の精度を向上させ、誤ったモデルを排除するとともに見過ごされていた遺伝子を発見する自動化パイプライン「GAP-MS」を開発し、9 種の主要作物でその有効性を実証したことを報告しています。

Abbas, Q., Wilhelm, M., Kuster, B., Frischman, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

本論文は、配列多様性や注記の非統一性により同定が困難であったシトクロム P450 酵素の構造データを、キーワード検索、HMM、構造アライメントを組み合わせたワークフローを用いて網羅的に同定・再注記し、5 つの新規サブファミリーを特定するとともに、標準化された命名法に基づいた厳密にキュレーションされた初の構造リンク登録データベースを構築したものである。

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

SELFormerMM: multimodal molecular representation learning via SELFIES, structure, text, and knowledge graph integration

本論文は、SELFIES、分子構造、テキスト記述、および知識グラフからの生物学的相互作用データを統合するマルチモーダル学習フレームワーク「SELFormerMM」を提案し、従来の単一モダリティモデルを上回る分子特性予測性能と、より豊かで生物学的に根拠のある表現学習を実現したことを報告しています。

Ulusoy, E., Bostanci, S., Deniz, B. E., Dogan, T.2026-03-19💻 bioinformatics

Super Bloom: Fast and precise filter for streaming k-mer queries

本論文は、ミニマイザーを用いて連続する k-mer をスーパー k-mer にグループ化し、キャッシュ効率を向上させる「Super Bloom Filter」と、誤判定を大幅に削減する「findere」方式を組み合わせることで、生物配列のストリーミング k-mer 問い合わせにおいて既存のブロッムフィルタを大幅に上回る高速性と精度を実現した手法を提案しています。

Conchon-Kerjan, E., Rouze, T., Robidou, L., Ingels, F., Limasset, A.2026-03-19💻 bioinformatics