バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

STRmie-HD enables interruption-aware HTT repeat genotyping and somatic mosaicism profiling across sequencing platforms

本論文は、Illumina、PacBio、Oxford Nanopore といった多様なシーケンシングプラットフォームに対応し、ハチントン病の原因遺伝子である HTT の CAG 反復配列における中断モチーフの検出や体細胞モザイク変異の定量的解析を単一リードレベルで可能にする、アライメント不要な新規ツール「STRmie-HD」を開発し、その高精度と従来ツールを超える感度を検証したものである。

Napoli, A., Liorni, N., Biagini, T., Giovannetti, A., Squitieri, A., Miele, L., Urbani, A., Caputo, V., Gasbarrini, A., Squitieri, F., Mazza, T.2026-03-25💻 bioinformatics

EvoRMD: Integrating Biological Context and Evolutionary RNA Language Models for Interpretable Prediction of RNA Modifications

EvoRMD は、大規模な RNA 言語モデルから得られる文脈埋め込みと生物学的メタデータを統合し、競合する修飾タイプ間の論理的推論を可能にする解釈可能な多クラス分類モデルとして、RNA 修飾の予測精度と生物学的洞察を向上させる新しい枠組みを提案しています。

Wang, B., Zhang, H., Cui, T., Wang, X., Song, J., Xu, H.2026-03-25💻 bioinformatics

Computational Design and Atomistic Validation of a High-Affinity VHH Nanobody Targeting the PI/RuvC Interface of Streptococcus pyogenes Cas9: A Bivalent Hub Strategy for CRISPR-Cas9 Enhancement

この論文は、生成拡散モデルと分子動力学シミュレーションを用いて、Streptococcus pyogenes Cas9 の PI/RuvC 界面に高親和性で結合する VHH ナノボディを計算機設計し、その構造安定性と二価ハブ戦略による CRISPR-Cas9 機能増強の可能性を原子レベルで検証したことを報告しています。

Kumar, N., Dalal, D., Sharma, V.2026-03-25💻 bioinformatics

AI-guided design of candidate BMPR1A-binding peptides for cartilage regeneration: a multi-tool computational benchmarking study

本研究は、軟骨再生を目的とした BMPR1A 結合ペプチドの設計において、RFdiffusion、BindCraft、PepMLM、RFpeptides の 4 種類の生成 AI ツールをベンチマークし、AlphaFold 3 や物理ベースのスコアリングを用いた多段階評価により、PepMLM 由来の候補ペプチドが最も有望であることを示すとともに、AI 駆動型のペプチド設計のための再現可能な計算フレームワークを確立したものである。

Ahmadov, A., Ahmadov, O.2026-03-25💻 bioinformatics

Visualize, Explore, and Select: A protein Language Model-based Approach Enabling Navigation of Protein Sequence Space for Enzyme Discovery and Mining

本論文は、タンパク質言語モデルの埋め込み表現と階層的クラスタリングを統合した「SelectZyme」というフレームワークを提案し、固定された配列同一性閾値に依存せず、酵素の機能空間を構造的に探索・選別することで、大規模な酵素発見やタンパク質工学の基盤を確立するものである。

Moorhoff, F., Medina-Ortiz, D., Kotnis, A., Hassanin, A., D. Davari, M.2026-03-25💻 bioinformatics

CBIcall: a configuration-driven framework for variant calling in large sequencing cohorts

CBIcall は、YAML 設定ファイルによる統制と実行駆動型の検証機能を通じて、多様な計算環境やワークフローバックエンドにまたがって大規模なコホート研究におけるバリアント呼び出しパイプラインの再現性と一貫性を保証するオープンソースのフレームワークです。

Rueda, M., Fernandez Orth, D., Gut, I. G.2026-03-25💻 bioinformatics

Population-scale interpretation of RNA isoform diversity enabled by Isopedia

Isopedia は参照配列に依存せず証拠に基づいたアノテーションを提供する拡張可能なデータ構造であり、1,007 のロングリードデータセットを用いた大規模な解析を通じて、RNA スプライシングによる転写産物の多様性を系統的に解釈し、ノイズと生物学的に活性なアイソフォームを明確に区別することを可能にします。

Zheng, X., Kronenberg, Z., Garcia-Ruiz, S., Layer, R. M., Gustavsson, E. K., Ryten, M., Sedlazeck, F. J.2026-03-25💻 bioinformatics

Compact longitudinal representations derived from mixed-format lifestyle questionnaires outperform static text-derived features for ALS-versus-control classification

ALS と対照群の分類において、構造化データ単体や静的なテキスト特徴量よりも、自由記述回答から抽出した「縦断的変化のコンパクトな記述」を組み合わせた特徴量が最も優れた予測性能を示すことが、漏洩を防止した機械学習パイプラインを用いた研究で明らかになりました。

Radlowski Nova, J., Lopez-Carbonero, J. I., Corrochano, S., Ayala, J. L.2026-03-25💻 bioinformatics

Single-cell Transcriptomic Variance Analysis Reveals Intercellular Circadian Desynchrony in the Alzheimer's Affected Human Brain

本研究では、時間経過を伴う単一細胞データにおける細胞間リズムの同期性を定量化する新たな解析手法「ORPHEUS」を開発し、アルツハイマー病の患者脳において興奮性ニューロンで顕著な細胞間時計の同期喪失が生じていることを明らかにしました。

Hollis, H. C., Veltri, A., Korac, K., Menon, V., Bennett, D. A., Ronnekleiv-Kelly, S., Kim, J., Anafi, R. C.2026-03-25💻 bioinformatics