バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

MIMIQ: Fast mutual information calculation and significance testing for single-cell RNA sequencing analysis

この論文は、単一細胞 RNA シーケンシングデータにおける計算コストと精度のトレードオフを克服し、負の二項分布を仮定した適応的ビンニング法とコピュラ変換を用いた相互情報量の高速計算および有意性検出手法「MIMIQ」を提案し、COVID-19 感染時の CD4+ ナイーブ T 細胞の遺伝子リワイヤリング解析への応用を示したものである。

O'Hanlon, D., Garcia Busto, S., Perez Carrasco, R.2026-04-13💻 bioinformatics

CRIS: A Centralized Resource for High-Quality RNA Structure and Interaction Data in the AI Era

本論文は、AI 時代における RNA 構造および相互作用データの再現性・品質・アクセシビリティの課題を解決するため、クロスリンキング技術に基づく高品質なデータセット、標準化されたワークフロー、およびユーザーフレンドリーなツールを提供する統合データベース「CRIS」を提案するものである。

Lee, W. H., Dharmawan, C., Li, K., Bai, J., Solanki, P., Sharma, A., Zhang, M., Lu, Z.2026-04-12💻 bioinformatics

KNexPHENIX: A PHENIX-Based Workflow for Improving Cryo-EM and Crystallographic Structural Models

本研究は、クライオ電子顕微鏡およびX線結晶構造解析の両方において、既存の手法よりも優れた立体化学的精度を維持しつつ過剰適合を防ぐことで、高品質な生体分子モデルの構築を可能にする新しいワークフロー「KNexPHENIX」を開発し、その有効性を実証したものである。

Nandi, S., Conn, G. L.2026-04-12💻 bioinformatics

Graph topology reframes the coherence of cell-state manifold inference under heterogeneous single-cell observations

本論文は、単細胞オミクス解析における観測の不均質性が低次元多様体推論に系統的な歪みを引き起こすことを示し、グラフトポロジーに基づく安定性記述子を提案することで、信頼性の高い細胞状態推論の領域を定義する手法を確立した。

Tamura, T., Yamane, Y., Okano, Y., Ishikawa, T., Sakurada, K.2026-04-12💻 bioinformatics

On the correctness of gene tree tagging under a unified model of gene duplication, loss, and coalescence

本論文は、遺伝子重複・消失・共分岐を統一的にモデル化する DLCoal モデル下において、ASTRAL-pro の遺伝子ツリータグ付けの正しさを定義し、その統計的性質を理論的に検討するとともにシミュレーションにより精度を評価したものである。

Parsons, R., Liu, Y., Dua, P., Markin, A., Molloy, E.2026-04-12💻 bioinformatics

Optimizing Protein Tokenization: Reduced Amino Acid Alphabets for Efficient and Accurate Protein Language Models

本論文は、アミノ酸の物性に基づいた縮小アルファベットと部分語トークナイゼーション(BPE)を組み合わせることで、タンパク質言語モデルの計算効率を大幅に向上させつつ、予測性能を維持または向上させる手法を提案し、その有効性を多様なタスクで実証したものである。

Rannon, E., Burstein, D.2026-04-12💻 bioinformatics

Cyclome: Large-scale replica-exchange dynamics of 930 cyclic peptide reveal thermal stability and critical metal-binding behavior

本論文は、930 種類の環状ペプチドを統合した大規模データベース「Cyclome930」を構築し、新規な環状配列アラインメント法、大規模分子動力学シミュレーション、および環状構造を考慮した機械学習モデルを組み合わせることで、環状ペプチドの熱安定性予測や重要金属結合性の評価を可能にする包括的な計算フレームワークを提案しています。

Sajeevan, K. A., Gates, H., Raghunath, V. S., Tan, C. P. H., Danurdoro, R., Young, J., Chowdhury, R.2026-04-12💻 bioinformatics

Pipette: Encoding scientific literature into an executable Skill Graph for multi-agent bioinformatics

本論文は、2 万を超える学術論文から抽出された「スキルグラフ」を用いて生物学的に妥当な分析遷移を制約する多エージェント AI フレームワーク「Pipette」を提案し、自然言語による対話で複雑なバイオインフォマティクスワークフローを自動生成・実行可能にすることで、専門的計算知識を必要とせずともゲノムデータから生物学的知見を得られるようにするものである。

Gupta, C., Sharma, A.2026-04-12💻 bioinformatics