バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

evedesign: accessible biosequence design with a unified framework

本論文は、機械学習を用いたタンパク質設計の非専門家の利用障壁を解消し、多目的最適化や実験との反復的連携を可能にする統合型オープンソースフレームワーク「evedesign」を提案し、抗体や酵素の設計・発見におけるその有用性を実証したものである。

Hopf, T. A., Gazizov, A., Garcia Busto, S., Eschbach, E., Lee, S., Mirdita, M., Orenbuch, R., Belahsen, K., Ross, D., Sander, C., Steinegger, M., d'Oelsnitz, S., Marks, D.2026-03-19💻 bioinformatics

Identification and classification of all Cytochrome P450 deposits in the Protein Data Bank

本論文は、配列多様性や注記の非統一性により同定が困難であったシトクロム P450 酵素の構造データを、キーワード検索、HMM、構造アライメントを組み合わせたワークフローを用いて網羅的に同定・再注記し、5 つの新規サブファミリーを特定するとともに、標準化された命名法に基づいた厳密にキュレーションされた初の構造リンク登録データベースを構築したものである。

Smieja, P., Zadrozna, M., Syed, K., Nelson, D., Gront, D.2026-03-19💻 bioinformatics

SELFormerMM: multimodal molecular representation learning via SELFIES, structure, text, and knowledge graph integration

本論文は、SELFIES、分子構造、テキスト記述、および知識グラフからの生物学的相互作用データを統合するマルチモーダル学習フレームワーク「SELFormerMM」を提案し、従来の単一モダリティモデルを上回る分子特性予測性能と、より豊かで生物学的に根拠のある表現学習を実現したことを報告しています。

Ulusoy, E., Bostanci, S., Deniz, B. E., Dogan, T.2026-03-19💻 bioinformatics

Super Bloom: Fast and precise filter for streaming k-mer queries

本論文は、ミニマイザーを用いて連続する k-mer をスーパー k-mer にグループ化し、キャッシュ効率を向上させる「Super Bloom Filter」と、誤判定を大幅に削減する「findere」方式を組み合わせることで、生物配列のストリーミング k-mer 問い合わせにおいて既存のブロッムフィルタを大幅に上回る高速性と精度を実現した手法を提案しています。

Conchon-Kerjan, E., Rouze, T., Robidou, L., Ingels, F., Limasset, A.2026-03-19💻 bioinformatics

RiboBA: a bias-aware probabilistic framework for robust ORF identification across diverse ribosome profiling protocols

本研究は、ライブラリ構築中に生じるプロトコル由来のバイアスを明示的に考慮し、シミュレーションおよび細胞種特異的免疫ペプチドミクスデータを用いた検証を通じて、特に RNase I や MNase などの多様なプロトコルにおいて非標準的 ORF の同定精度と感度を向上させる確率的フレームワーク「RiboBA」を開発したことを報告しています。

BAI, J., Yang, R.2026-03-19💻 bioinformatics

An AI-Driven Decision-Support Tool for Triage of COVID-19 Patients Using Respiratory Microbiome Data

この論文は、呼吸器マイクロバイオームデータと臨床情報を統合して XGBoost などの機械学習モデルを構築し、COVID-19 患者の重症度や転帰を高精度に予測・トリアージするための AI 支援ツールの有効性を示したものである。

Avina-Bravo, E. G., Garcia-Lorenzo, I., Alfaro-Ponce, M., Breton-Deval, L.2026-03-19💻 bioinformatics

DOTSeq enables genome-wide detection of differential ORF usage

本研究は、リボソームプロファイリング実験において遺伝子レベルではなくオープンリーディングフレーム(ORF)レベルで翻訳調節を検出・定量化するための統計フレームワーク「DOTSeq」を開発し、ORF 使用率の変化(DOU)と翻訳効率(DTE)を包括的に解析するエンドツーエンドのワークフローを提供することを示しています。

Lim, C. S., Chieng, G. S. W.2026-03-18💻 bioinformatics

Developing a Standard Definition for Sequences of Concern

本論文は、核酸合成のバイオセキュリティリスク管理における「懸念配列」の定義の欠如を解消するため、ステークホルダーによる科学的レビューを経て、病原体や毒素の配列を特定するための基準(ルブリック)を策定し、既存のスクリーニングシステム間の合意を高め、バイオセキュリティ政策の基盤となる具体的な定義を提供したものである。

Alexanian, T., Beal, J., Bartling, C., Berlips, J., Carr, P. A., Clore, A., Cozzarini, H., Diggans, J., El Moubayed, Y., Esvelt, K., Flyangolts, K., Foner, L., Fullerton, P. A., Gemler, B. T., Jagla (…)2026-03-18💻 bioinformatics