バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Genomic-island cassette architecture drives pathogenic Enterococcus cecorum lineages: Cassette2Vec-EC, a structural genomics and machine-learning framework

本研究は、家禽由来の病原性エンテロコッカス・セコラムの系統を予測するために、ゲノムアイランドの構造的な配列(カセット)を機械学習用ベクトルに変換し、ゲノムレベルのデータリークを防ぎながら特定の高リスクモジュールを同定する「Cassette2Vec-EC」という新しいフレームワークを提案しています。

Goswami, A., Rafi, S., Lagad, R.2026-02-21💻 bioinformatics

On Deriving Synteny Blocks by Compacting Elements

この論文は、ゲノム配列データから直接シテニーブロックを導出するための形式的枠組みを提案し、一般には NP 困難である最適化問題に対して、共線性と共有要素の条件を課すことで両方の目的関数を同時に最小化する線形時間アルゴリズムを開発したことを示しています。

Bohnenkaemper, L., Parmigiani, L., Chauve, C., Stoye, J.2026-02-20💻 bioinformatics

Embarrassingly_FASTA: Enabling Recomputable, Population-Scale Pangenomics by Reducing Commercial Genome Processing Costs from $100 to less than $1

この論文は、GPU 加速とスポットインスタンスの活用によりゲノム前処理コストを劇的に削減し、生データ(FASTQ)の保存と再計算を可能にすることで、大規模なパンゲノム研究を経済的に実現する「Embarrassingly_FASTA」というシステムを提案しています。

Walsh, D. J., Njie, e. G.2026-02-20💻 bioinformatics

ProteoMapper: Alignment-Aware Identification and Quantitative Analysis of Contextual Motif-Domain Patterns in Protein Families

ProteoMapper は、HMMER ベースのドメイン注釈とユーザー定義のモチーフ検出を統合し、タンパク質ファミリーにおけるモチーフとドメインの空間的関係や進化的制約を定量的に評価するための、プログラミング不要の計算フレームワークである。

Sefa, S. M., Sarkar, J., Robin, A. H. K., Uddin, M.2026-02-20💻 bioinformatics

Geometric-aware and interpretable deep learning for single-cell batch correction via explicit disentanglement and optimal transport

本論文は、明示的な特徴量分離と最適輸送正則化に基づく解釈可能な深層学習フレームワーク「iDLC」を提案し、大規模な単一細胞データにおいてバッチ効果を効果的に除去しつつ、生物学的な多様性や連続的な発現パターンを高精度に保持することを示しています。

Jiang, C., Zheng, R., Ji, Y., Cao, S., Fang, Y., Wang, Z., Wang, R., Liang, S., Tao, S.2026-02-20💻 bioinformatics

TSUMUGI: a platform for phenotype-driven gene network identification from comprehensive knockout mouse phenotyping data

この論文は、国際マウス表現型コンソーシアム(IMPC)の包括的なノックアウトマウス表現型データを活用し、特定の表現型や遺伝子リストから機能関連遺伝子ネットワークを同定・可視化して複雑な生物学的現象の解釈を支援するプラットフォーム「TSUMUGI」を開発したことを報告しています。

Kuno, A., Matsumoto, K., Taki, T., Takahashi, S., Mizuno, S.2026-02-20💻 bioinformatics

A New Sparse Bayesian Quantile Neural Network-based Approach and Its Application to Discover Physiological Sweet Spots in the Canadian Longitudinal Study on Aging

カナダの高齢者コホート研究データを用いて、新しいスパースベイズ量子回帰ニューラルネットワーク手法(Q-FSNet および Q-DirichNet)を開発し、生物学的老化の加速を最小化する代謝物質の「生理学的スイートスポット(最適範囲)」を同定することで、精密医療における健康な老化のメタボロームシグネチャーの発見に貢献しました。

Min, J., Vishnyakova, O., Brooks-Wilson, A., Elliott, L. T.2026-02-20💻 bioinformatics

OT-knn: a neighborhood-aware optimal transport framework for aligning spatial transcriptomics data

この論文は、空間的ノイズや生物学的なばらつきに頑健な空間トランスクリプトミクスデータの整列を実現するため、最適輸送枠組みに局所近傍情報を統合した新しい手法「OT-knn」を提案し、ヒト・マウス・イモリなど多様な生物種および実験条件におけるその有効性を実証したものである。

Song, J., Li, Q.2026-02-20💻 bioinformatics