バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Mapping spatial cell-cell communication programs by tailoring chains of cells for transformer neural networks

本研究は、トランスフォーマー型ニューラルネットワークを用いて細胞間の通信連鎖をモデル化し、空間トランスクリプトミクスデータから生物学的に意味のある細胞間通信プログラムを同定するとともに、スポットおよび単一細胞レベルで通信のホットスポットを局在化する新しいフレームワーク「scCChain」を提案するものである。

Brunn, N., Guitart, L. C., Farhadyar, K., Fullio, C. L., Kailer, J., Vogel, T., Hackenberg, M., Binder, H.2026-03-20💻 bioinformatics

Systematic assessment of machine learning-based variant annotation methods for rare variant association testing

本論文は、UK バイオバンクのデータを用いて、稀な変異の関連性検出における機械学習ベースのアノテーション手法(CADD、AlphaMissense など)を体系的に評価し、検出力と較正の観点から最適な手法選択の実践的指針と較正評価のための分布論的枠組みを確立したものである。

Aguirre, M., Irudayanathan, F. J., Crow, M., Hejase, H. A., Menon, V. K., Pendergrass, R. K., McCarthy, M. I., Fletez-Brant, K.2026-03-20💻 bioinformatics

ISdetector: precise mapping of insertion sequences and associated structural variations from short-read sequencing data

ISdetector は、軟クリップリードのクラスター化と IS クリーン参照戦略を組み合わせて、短リードシーケンシングデータから挿入配列の正確な挿入部位および付随する構造変異を高精度に検出する、スケーラブルなバイオインフォマティクスパイプラインです。

Zhou, Y., Lu, B.2026-03-20💻 bioinformatics

Improving genomic language model reliability under distribution shift

本論文は、分布シフト下でのゲノム言語モデルの信頼性を向上させるため、温度スケーリングやエピステミック・ニューラルネットワークといった不確実性定量化手法の有効性を多様なゲノムおよびメタゲノム予測タスクにおいて検証し、分類の信頼性向上を実証したものである。

Hearne, G., Refahi, M. S., Polikar, R., Rosen, G. L.2026-03-20💻 bioinformatics

Bacteriophage host prediction using a genome language model

本論文は、事前学習されたゲノム言語モデル「Evo2」の埋め込み表現を用いてファージ宿主を予測する手法を提案し、既存の配列相同性や k-mer 法と組み合わせることで、特に宿主の移動遺伝子要素が少なく中程度のゲノム長を持つファージにおいて、宿主範囲の予測精度を向上させることを示しています。

WANG, Z., Arsuaga, J.2026-03-20💻 bioinformatics

Leveraging Large Language Models to Extract Prognostic Pathology Features in Ewing Sarcoma

この研究では、大規模言語モデル(LLM)を用いてエウイング肉腫の病理報告書から構造化データを高精度に抽出し、NSE 陽性が悪予後、S100 陽性が良好な予後と関連することを示すことで、従来の臨床因子に加え組織学的特徴をリスク層別化に統合する可能性を提示しました。

Huang, J., Batool, A., Gu, Z., Zhao, Z., Yao, B., Black, J., Davis, J., al-Ibraheemi, A., DuBois, S., Barkauskas, D., Ramakrishnan, S., Hall, D., Grohar, P., Xie, Y., Xiao, G., Leavey, P. J.2026-03-19💻 bioinformatics

A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment

本研究は、ヒトの基盤モデル注釈を活用してマカク属の単細胞トランスクリプトーム・アトラスを構築し、創薬ターゲットの同定や毒性メカニズムの解明を支援することで、非ヒト霊長類実験の削減と精密化を促進する統合リソースを提供するものである。

Souza, T. M., Gamse, J. T., Moreno, L., van Rumpt, M., Nunez-Moreno, G., Khatri, I., van Asten, S. D., Khusial, N. V., Baltasar-Perez, E., Adhav, R., Abdelaal, T., Wojtuszkiewicz, A., Calis, J. J. A. (…)2026-03-19💻 bioinformatics