バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

DOME Copilot: Making transparency and reproducibility for artificial intelligence methods simple

DOME Copilot は大規模言語モデルを活用して AI 手法の構造化レポートを自動抽出し、生命科学分野における AI 研究の透明性と再現性を簡素化する革新的なソリューションです。

Farrell, G., Attafi, O. A., Fragkouli, S.-C., Heredia, I., Fernandez Tobias, S., Harrison, M., Hermjakob, H., Jeffryes, M., Obregon Ruiz, M., Pearce, M., Pechlivanis, N., Lopez Garcia, A., Psomopoulos (…)2026-04-19💻 bioinformatics

Calibration of in-frame indel variant effect predictors for clinical variant classification

本論文は、臨床的変異分類におけるインフレーム挿入・欠失(indel)変異予測ツールの性能評価と、ACMG/AMP ガイドラインに基づく閾値の較正を行い、これらが臨床的価値を持つ一方でミスセンス変異予測ツールに比べて性能が低いことを明らかにしました。

Abderrazzaq, H., Singh, M., Babb, L., Bergquist, T., Brenner, S. E., Pejaver, V., O'Donnell-Luria, A., Radivojac, P., ClinGen Computational Working Group,, ClinGen Variant Classification Working Group (…)2026-04-18💻 bioinformatics

LagCI Enables Inference of Temporal Causal Relationships from Dense Multi-Omic Time Series

本研究では、高密度な多オミクス時系列データから時間的な因果関係を推論するための計算フレームワーク「LagCI」を開発し、その有効性を生理学的データおよびヒトの多オミクスデータを用いて実証し、代謝と免疫応答のタイミングを調整する分子ハブの同定に成功したことを報告しています。

Ge, Y., Bai, S., Qiang, Z., Liu, Y., Wu, Y., Shen, X.2026-04-18💻 bioinformatics

The role of space in explaining macroecological patterns of microbial abundance

本研究は、微生物群集の個体数分布がガンマ分布に従うというマクロ生態学的パターンが、個々のパッチ内では再現されないものの、空間的に分断されたメタコミュニティにおけるパッチ間での集約によって説明可能であることを示し、観測される分布が生物学的メカニズムそのものではなく、空間的な粗視化(サンプリング)に起因する可能性を提唱しています。

Gutierrez-Arroyo, A., Lampo, A., Cuesta, J. A.2026-04-18💻 bioinformatics

Scaling SMILES-Based Chemical Language Models for Therapeutic Peptide Engineering

本論文では、天然アミノ酸に限定されるタンパク質モデルや化学モデルの限界を克服し、1 億以上の分子で学習された「PeptideCLM-2」という化学言語モデルの suite を提案し、治療用ペプチドの膜透過性、腫瘍ターゲティング、半減期などの開発指標予測において既存手法を上回る性能を実現したことを報告しています。

Feller, A. L., Secor, M., Swanson, S., Wilke, C. O., Deibler, K.2026-04-17💻 bioinformatics

Agent-Guided De Novo Design of Nanobody Binders Against a Novel Cancer Target

本研究は、エピトープ特定から生成、スコアリング、実験的検証までのエージェント支援ワークフローを用いて、実験構造や既知の抗体情報なしに新規がんターゲットに対するナノボディー結合体を設計し、ナノモルからサブナノモルレベルの親和性を持つ結合体を成功裏に獲得したことを示しています。

Zhao, Y., Yilmaz, M., Lee, E., Teh, C., Guo, L., Sonmez, K., Giancardo, L., Trang, G., Xu, F., Espinosa-Cotton, M., Cheung, N.-K., Kim, J., Cheng, X.2026-04-17💻 bioinformatics

Uncertainty-aware benchmarking reveals ambiguous transcripts in mRNA-lncRNA classification

本研究は、GENCODE アノテーションの安定したサブセットを用いた不確実性意識ベンチマークと拡張特徴量解析により、mRNA と lncRNA の分類におけるツール間の不一致や誤分類の要因を解明し、より頑健な分類器の開発と分類不確実性の解釈に実用的な指針を提供する新たな枠組みを提示しました。

Garcia-Ruano, D., Georges, M., Mohanty, S. K., Baaziz, R., Makova, K. D., Nikolski, M., Chalopin, D.2026-04-17💻 bioinformatics

PathwaySeeker: Evidence-Grounded AI Reasoning over Organism-Specific Metabolic Networks

本研究は、タンパク質および代謝物データを統合してサンプル固有の代謝グラフを再構築し、その構造に基づいて大規模言語モデルを微調整するとともに、実験的証拠に基づく仮説探索(Oracle-in-the-Loop 推論)を通じて各推論ステップを検証する AI システム「PathwaySeeker」を開発し、非モデル生物 Trametes versicolor のデータを用いて、実験的に確認された代謝経路と検証が必要な仮説を明確に区別する新たなアプローチを提案したものである。

Oliveira Monteiro, L. M., Chowdhury, N. B., Oostrom, M., McDermott, J. E., Stratton, K. G., Choudhury, S., Bardhan, J. P.2026-04-17💻 bioinformatics