バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Functional-space alignment resolves the eco-evolutionary landscape of siderophore biosynthesis across bacteria

本研究は、大規模言語モデルと機能空間に基づく配列比較手法「BGC Block Aligner」を開発し、9 万 7 千以上の細菌ゲノムを解析することで、シデロフォア生合成が系統関係よりも生態的ライフスタイルによって駆動され、細菌界全体で極めて普遍的に存在することを明らかにしました。

Shao, J., Wu, Y., Tian, S., Xu, R., Luo, H., He, R., Shao, Y., Yu, L., Xiong, G., Guo, P., Nan, R., Wei, Z., Gu, S., Li, Z.2026-04-15💻 bioinformatics

A little longer, a lot better: simulation-guided exploration of extended-length single-end barcoded reads for structural variant detection

本研究では、stLFR-sim シミュレーターを用いて評価した結果、500bp や 1000bp の長い単一エンドバーコードリード(SE500/SE1000_stLFR)が、構造変異の検出精度を大幅に向上させ、長鎖シーケンシングに匹敵する性能を発揮し得ることを示しました。

Luo, C., Liu, Y. H., Liu, H., Zhang, Z., Zhang, L., Peters, B. A., Zhou, X. M.2026-04-15💻 bioinformatics

Exploring molecular signatures of senescence with markeR, an R toolkit for evaluating gene sets as phenotypic markers

本研究では、細胞老化などの複雑な生物学的状態を特定するための遺伝子セットの性能を体系的に評価する R パッケージ「markeR」を開発し、複数のデータセットを用いた検証を通じて、遺伝子セットの選択が文脈に依存して大きく異なることを示し、その汎用性を実証しました。

Martins-Silva, R., Kaizeler, A., Barbosa-Morais, N. L.2026-04-15💻 bioinformatics

Longevity Bench: Are SotA LLMs ready for aging research?

本論文は、老化生物学の基本原理の理解や生体データに基づく表現型の推論能力を評価するためのベンチマーク「LongevityBench」を提案し、最先端の基礎モデルの限界を明らかにするとともに、老化研究におけるその活用方法を論じています。

Zhavoronkov, A., Sidorenko, D., Naumov, V., Pushkov, S., Zagirova, D., Aladinskiy, V., Unutmaz, D., Aliper, A., Galkin, F.2026-04-15💻 bioinformatics

DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics

DIA-CLIP は、対照学習とエンコーダ - デコーダ構造を統合した事前学習モデルにより、従来の半教師あり学習に依存せず、種や実験条件を越えたゼロショットで高精度なペプチド - スペクトラムマッチングを実現し、タンパク質同定数を大幅に向上させる汎用的な DIA プロテオミクス解析フレームワークです。

Liao, Y., Wen, H., E, W., Zhang, W.2026-04-15💻 bioinformatics

TFBindFormer: A Cross-Attention Transformer for Transcription Factor-DNA Binding Prediction

本論文は、DNA 配列だけでなく転写因子のタンパク質情報も統合したハイブリッド・クロス・アテンション・トランスフォーマー「TFBindFormer」を提案し、大規模な転写因子と DNA の結合予測において既存の DNA のみのモデルを大幅に上回る精度を達成したことを報告しています。

Liu, P., Wang, L., Basnet, S., Cheng, J.2026-04-15💻 bioinformatics

U-Probe: universal agentic probe design for imaging-based spatial-omics

U-Probe は、自然言語による対話と DAG ベースの組み立てエンジンを用いて、既存の手法から新規アーキテクチャまであらゆる FISH プロトコルに対応する汎用的なプローブ設計プラットフォームであり、専門知識を必要とせずに合成用配列を生成することを可能にします。

Zhang, Q., Cai, H., Zhang, J., Zhang, L., Wu, X., Wei, Y., Chen, Y., Wu, X., Su, W., Qi, W., Qiu, X., Cao, G., Xu, W.2026-04-15💻 bioinformatics

CROssBARv2: A Unified Computational Framework for Heterogeneous Biomedical Data Representation and LLM-Driven Exploration

本研究は、断片化された生体医学データを標準化されたオントロジーとベクトル埋め込みを備えた大規模知識グラフに統合し、LLM のハルシネーションを抑制した自然言語検索や予測モデリングを可能にする統合フレームワーク「CROssBARv2」を提案し、その有効性を多角的に検証したものである。

Sen, B., Ulusoy, E., Darcan, M., Ergun, M., Lobentanzer, S., Rifaioglu, A. S., Turei, D., Saez-Rodriguez, J., Dogan, T.2026-04-15💻 bioinformatics

Discovery of Selective Nrf2 Activators from Natural Products: AComputational Screening Approach to Minimize Off-Target Effects on PXR and CYP2D6

本論文は、62 万 8,898 種類の天然産物からコンピューターシミュレーションを用いて大規模スクリーニングを行い、Nrf2 活性化を促進しつつ PXR や CYP2D6 への非特異的干渉を最小限に抑えた 10 件の高選択性候補化合物を同定し、酸化ストレス関連疾患に対するより安全で精密な治療薬開発の基盤を築いたことを報告しています。

Wang, Y., Gong, Y., Li, R., Li, Z., Cai, H., Fan, L., Ma, H.2026-04-15💻 bioinformatics