バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Hierarchical genomic feature annotation with variable-length queries

この論文は、Spectral Burrows-Wheeler Transform (SBWT) を基盤とし、可変長の k-mer に対して階層的な特徴注釈を正確かつ損失なく行い、多対一致や新規配列の問題を解決する新たなデータ構造「HKS」を提案し、ヒトゲノムアノテーションにおける高い精度と既存ツールとの同等の処理速度を実証したものである。

Alanko, J. N., Ranallo-Benavidez, T. R., Barthel, F. P., Puglisi, S. J., Marchet, C.2026-03-18💻 bioinformatics

HARVEST: Unlocking the Dark Bioactivity Data of Pharmaceutical Patents via Agentic AI

本論文は、特許文書に埋もれていた構造化されていない生体活性データを自律的な AI マルチエージェントシステム「HARVEST」によって効率的に抽出・構造化し、既存データベースに存在しない膨大な新規化合物とタンパク質ターゲットを解明するとともに、そのデータを用いた評価により既存モデルの構造的・機能的な一般化限界を明らかにしたものである。

Shepard, V., Musin, A., Chebykina, K., Zeninskaya, N. A., Mistryukova, L., Avchaciov, K., Fedichev, P. O.2026-03-18💻 bioinformatics

Sex Checking by Zygosity Distributions

本研究は、追加データや閾値調整を必要とせず、標準的な VCF ファイル上の X 染色体遺伝子型分布に基づいて機械学習モデルを多項式方程式に凝縮し、全ゲノム配列やアレイデータなど多様なデータ形式で高精度かつ効率的に性別判定を行う新しい手法「Zigo」を提案したものである。

Molina-Sedano, O., Mas Montserrat, D., Ioannidis, A. G.2026-03-18💻 bioinformatics

SpeciefAI: Multi-species mRNA-level Antibody Framework Generation using Transformers

本論文は、抗体やナノボディの CDR 領域を入力として、ヒトや犬など 6 種の生物種に特化した mRNA 配列とタンパク質フレームワーク領域を同時に生成するトランスフォーマーベースのモデル「SpeciefAI」を提案し、宿主種での効率的な発現と免疫原性の低減を両立させる手法を確立したものである。

Grabarczyk, D., Kocikowski, M., Parys, M., Cohen, S. B., Alfaro, J. A.2026-03-18💻 bioinformatics