バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Differentiable Gene Set Enrichment Analysis for Pathway-Level Supervision in Transcriptomic Learning

本論文は、転写オミクス予測における遺伝子レベルの目的関数と経路レベルの解釈の不一致を解消するため、古典的 GSEA の統計的意味を維持しつつ微分可能で計算効率的な「dGSEA」手法を提案し、経路レベルの整合性を向上させることを示しています。

Li, S., Ruan, Y., Yang, X., Wen, Z., Saigo, H.2026-03-20💻 bioinformatics

ECHO: a nanopore sequencing-based workflow for (epi)genetic profiling of the human repeatome

本論文は、Oxford Nanopore シーケンシングを用いてヒトゲノム内の反復配列(リピート)の遺伝的・エピジェネティックな変異を包括的かつ同時に解析するための、ユーザーフレンドリーでスケーラブルなパイプライン「ECHO」を開発したことを報告しています。

Poggiali, B., Putzeys, L., Andersen, J. D., Vidaki, A.2026-03-20💻 bioinformatics

Mapping spatial cell-cell communication programs by tailoring chains of cells for transformer neural networks

本研究は、トランスフォーマー型ニューラルネットワークを用いて細胞間の通信連鎖をモデル化し、空間トランスクリプトミクスデータから生物学的に意味のある細胞間通信プログラムを同定するとともに、スポットおよび単一細胞レベルで通信のホットスポットを局在化する新しいフレームワーク「scCChain」を提案するものである。

Brunn, N., Guitart, L. C., Farhadyar, K., Fullio, C. L., Kailer, J., Vogel, T., Hackenberg, M., Binder, H.2026-03-20💻 bioinformatics

HViLM: A Foundation Model for Viral Genomics Enables Multi-Task Prediction of Pathogenicity, Transmissibility, and Host Tropism

この論文は、500 万のウイルス配列で事前学習されたファウンデーションモデル「HViLM」を提案し、LoRA による効率的な微調整を通じて病原性、宿主特異性、伝播性の 3 つの疫学的特性を高い精度で予測できることを実証したものである。

Davuluri, R. V., Dutta, P., Vaska, J., Surana, P., Sathian, R., Chao, M., Zhou, Z., Liu, H.2026-03-20💻 bioinformatics

Systematic assessment of machine learning-based variant annotation methods for rare variant association testing

本論文は、UK バイオバンクのデータを用いて、稀な変異の関連性検出における機械学習ベースのアノテーション手法(CADD、AlphaMissense など)を体系的に評価し、検出力と較正の観点から最適な手法選択の実践的指針と較正評価のための分布論的枠組みを確立したものである。

Aguirre, M., Irudayanathan, F. J., Crow, M., Hejase, H. A., Menon, V. K., Pendergrass, R. K., McCarthy, M. I., Fletez-Brant, K.2026-03-20💻 bioinformatics

ISdetector: precise mapping of insertion sequences and associated structural variations from short-read sequencing data

ISdetector は、軟クリップリードのクラスター化と IS クリーン参照戦略を組み合わせて、短リードシーケンシングデータから挿入配列の正確な挿入部位および付随する構造変異を高精度に検出する、スケーラブルなバイオインフォマティクスパイプラインです。

Zhou, Y., Lu, B.2026-03-20💻 bioinformatics

Designing mRNA coding sequence via multimodal reverse translation language modeling with Pro2RNA

Pro2RNA は、タンパク質配列と宿主生物の分類学的情報を統合したマルチモーダル逆翻訳言語モデルとして、特定の宿主に最適化された mRNA コーディング配列を生成し、既存の手法を上回る性能を示す革新的なフレームワークを提案しています。

Bian, B., Zhang, Y., Zhang, J., Asai, K., Saito, Y.2026-03-20💻 bioinformatics

Improving genomic language model reliability under distribution shift

本論文は、分布シフト下でのゲノム言語モデルの信頼性を向上させるため、温度スケーリングやエピステミック・ニューラルネットワークといった不確実性定量化手法の有効性を多様なゲノムおよびメタゲノム予測タスクにおいて検証し、分類の信頼性向上を実証したものである。

Hearne, G., Refahi, M. S., Polikar, R., Rosen, G. L.2026-03-20💻 bioinformatics

Bacteriophage host prediction using a genome language model

本論文は、事前学習されたゲノム言語モデル「Evo2」の埋め込み表現を用いてファージ宿主を予測する手法を提案し、既存の配列相同性や k-mer 法と組み合わせることで、特に宿主の移動遺伝子要素が少なく中程度のゲノム長を持つファージにおいて、宿主範囲の予測精度を向上させることを示しています。

WANG, Z., Arsuaga, J.2026-03-20💻 bioinformatics