バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

この論文は、openSNP データセットから抽出された 80 の二値表現型を用いて、機械学習・深層学習アルゴリズムと多遺伝子リスクスコアツールをベンチマークし、表現型によってそれぞれが異なる性能を発揮することを明らかにしたものである。

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics

MapMyCells: High-performance mapping of unlabeled cell-by-gene data to reference brain taxonomies

MapMyCells は、Allen 脳科学研究所や BRAIN 計画などが作成した高品質な脳細胞参照分類体系に、最小限の前処理で多様な単一細胞オミクスデータを効率的かつ再現性高くマッピングし、種やモダリティを越えた細胞タイプの注釈付けと統合を可能にするオープンソースフレームワークである。

Daniel, S. F., Lee, C., Mollenkopf, T., Lee, M., Arbuckle, J., Fiabane, E., Gabitto, M. I., Johansen, N., Kapen, I., Kraft, A. W., Lai, J., Li, S. Y., McGinty, R., Miller, J. A., Welch-Moosman, S., Ot (…)2026-03-09💻 bioinformatics

anndataR improves interoperability between R and Python in single-cell transcriptomics

この論文は、Python の scverse エコシステムで普及している H5AD 形式の単一細胞トランスクリプトミクスデータを R 環境でネイティブに読み書き・変換可能にするパッケージ「anndataR」を開発し、両言語間の相互運用性を向上させたことを報告しています。

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

この論文は、哺乳類および霊長類の感染性を予測するための遺伝子配列データセットを大幅に拡張・標準化し、機械学習モデルの性能評価において分類タスクの難易度が宿主の分類群の広さや訓練データとテストデータの系統距離に依存することを示すとともに、異なるウイルス科間での予測が現状では困難であることを明らかにしたものである。

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

MiRformer は、長い mRNA 配列を効率的に処理するスライディングウィンドウ注意機構を備えた双トランスフォーマーアーキテクチャを採用し、mRNA 条件付き miRNA の生成、結合部位の特定、および相互作用予測において最先端の性能と生物学的解釈性を両立する統合生成フレームワークです。

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

本研究は、生物学的データに内在するノイズや変動を確率的にモデル化し、パラメータ推定、予測、実験設計を効率化するための高速かつ柔軟なオープンソースソフトウェア「Stochastic System Identification Toolkit (SSIT)」を開発し、その機能を酵母および乳がん細胞の単一細胞データを用いて実証したものである。

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

HP2NET: Empowering Efficient Phylogenetic Network Analysis through High-Performance Computing

この論文は、PhyloNetworks や PhyloNet などの最先端ツールを統合し、HPC 環境におけるタスクパッケージングやデータ再利用、並列実行を通じて、大規模な系統ネットワーク解析の効率性と再現性を飛躍的に向上させる新しいフレームワーク「HP2NET」を提案し、デングウイルスのゲノム解析による実証を通じてその有用性を示したものである。

Terra, R., Carvalho, D., Machado, D. J., Osthoff, C., Ocana, K.2026-03-08💻 bioinformatics

MS-BCR-DB: an integrated BCR repertoire database to mine humoral multiple sclerosis signatures

本論文は、多発性硬化症(MS)における B 細胞受容体レパートリーの特徴を解明するため、臨床および技術的メタデータを統合した世界初の公衆アクセス可能なデータベース「MS-BCR-DB」を開発し、EB ウイルスや中枢神経系自己タンパク質を認識する抗体の同定など、病態メカニズムの解明とバイオマーカー開発への基盤を提供したことを報告しています。

Ballerini, C., Cardente, N., Abbate, M. F., Le Quy, K., Rincon, N., Wolfram, L., Lossius, A., Portaccio, E., Amato, M. P., Ballerini, C., Greiff, V.2026-03-08💻 bioinformatics