バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

DOTSeq enables genome-wide detection of differential ORF usage

本研究は、リボソームプロファイリング実験において遺伝子レベルではなくオープンリーディングフレーム(ORF)レベルで翻訳調節を検出・定量化するための統計フレームワーク「DOTSeq」を開発し、ORF 使用率の変化(DOU)と翻訳効率(DTE)を包括的に解析するエンドツーエンドのワークフローを提供することを示しています。

Lim, C. S., Chieng, G. S. W.2026-03-18💻 bioinformatics

Developing a Standard Definition for Sequences of Concern

本論文は、核酸合成のバイオセキュリティリスク管理における「懸念配列」の定義の欠如を解消するため、ステークホルダーによる科学的レビューを経て、病原体や毒素の配列を特定するための基準(ルブリック)を策定し、既存のスクリーニングシステム間の合意を高め、バイオセキュリティ政策の基盤となる具体的な定義を提供したものである。

Alexanian, T., Beal, J., Bartling, C., Berlips, J., Carr, P. A., Clore, A., Cozzarini, H., Diggans, J., El Moubayed, Y., Esvelt, K., Flyangolts, K., Foner, L., Fullerton, P. A., Gemler, B. T., Jagla (…)2026-03-18💻 bioinformatics

Millisecond Prediction of Protein Contact Maps from Amino AcidSequences

この論文は、アミノ酸配列からミリ秒単位でタンパク質の接触マップを予測する高速な生成モデルを開発し、二次構造要素への粗視化表現とフローマッチングを活用することで、タンパク質のトポロジカルな特徴を高精度に捉え、変異体の構造探索を可能にする手法を提案しています。

Lin, R., Ahnert, S. E.2026-03-18💻 bioinformatics

usiGrabber: Automating the curation of proteomics spectra data at scale, making large datasets ready for use in machine learning systems

本論文は、PRIDE データベースから大規模な質量分析プロテオミクスデータを自動的に収集・構造化し、機械学習モデルの再訓練に直接活用可能な大規模データセットを迅速に構築するスケーラブルなフレームワーク「usiGrabber」を提案し、その有効性をリン酸化特異的分類器の再訓練による実証で示したものです。

Auge, G., Clausen, M., Ketterer, K., Schaefer, J., Schmitt, N., Altenburg, T., Hartmaring, Y., Raetz, H., Schlaffner, C. N., Renard, B. Y.2026-03-18💻 bioinformatics

DeSCENT: Deconvolutional Single-Cell RNA-seq Enhances Transcriptome-based Cancer Survival Analysis

本研究では、バッチ RNA シーケンスデータから単一細胞レベルの転写プロファイルを再構築するデコンボリューション手法「DeSCENT」を提案し、TCGA の 8 つの癌コホートにおける生存分析において、従来のバッチデータのみや細胞情報単独を用いたモデルよりも優れた性能を示したことを報告しています。

Zhao, Y., You, Z., Shen, Y., Chu, J., Gong, X., Li, T., Wang, Z., Xu, C., Luo, Z., He, Y.2026-03-18💻 bioinformatics

Hierarchical genomic feature annotation with variable-length queries

この論文は、Spectral Burrows-Wheeler Transform (SBWT) を基盤とし、可変長の k-mer に対して階層的な特徴注釈を正確かつ損失なく行い、多対一致や新規配列の問題を解決する新たなデータ構造「HKS」を提案し、ヒトゲノムアノテーションにおける高い精度と既存ツールとの同等の処理速度を実証したものである。

Alanko, J. N., Ranallo-Benavidez, T. R., Barthel, F. P., Puglisi, S. J., Marchet, C.2026-03-18💻 bioinformatics

HARVEST: Unlocking the Dark Bioactivity Data of Pharmaceutical Patents via Agentic AI

本論文は、特許文書に埋もれていた構造化されていない生体活性データを自律的な AI マルチエージェントシステム「HARVEST」によって効率的に抽出・構造化し、既存データベースに存在しない膨大な新規化合物とタンパク質ターゲットを解明するとともに、そのデータを用いた評価により既存モデルの構造的・機能的な一般化限界を明らかにしたものである。

Shepard, V., Musin, A., Chebykina, K., Zeninskaya, N. A., Mistryukova, L., Avchaciov, K., Fedichev, P. O.2026-03-18💻 bioinformatics