バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

anndataR improves interoperability between R and Python in single-cell transcriptomics

この論文は、Python の scverse エコシステムで普及している H5AD 形式の単一細胞トランスクリプトミクスデータを R 環境でネイティブに読み書き・変換可能にするパッケージ「anndataR」を開発し、両言語間の相互運用性を向上させたことを報告しています。

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

この論文は、哺乳類および霊長類の感染性を予測するための遺伝子配列データセットを大幅に拡張・標準化し、機械学習モデルの性能評価において分類タスクの難易度が宿主の分類群の広さや訓練データとテストデータの系統距離に依存することを示すとともに、異なるウイルス科間での予測が現状では困難であることを明らかにしたものである。

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

MiRformer は、長い mRNA 配列を効率的に処理するスライディングウィンドウ注意機構を備えた双トランスフォーマーアーキテクチャを採用し、mRNA 条件付き miRNA の生成、結合部位の特定、および相互作用予測において最先端の性能と生物学的解釈性を両立する統合生成フレームワークです。

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

本研究は、生物学的データに内在するノイズや変動を確率的にモデル化し、パラメータ推定、予測、実験設計を効率化するための高速かつ柔軟なオープンソースソフトウェア「Stochastic System Identification Toolkit (SSIT)」を開発し、その機能を酵母および乳がん細胞の単一細胞データを用いて実証したものである。

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

Deciphering Cell Cycle Dynamics and Cell States in Single-cell RNA-seq data with SPAE

本論文は、単一細胞 RNA シーケンシングデータにおける細胞周期動態と細胞状態の解析精度と頑健性を大幅に向上させる統合型正弦波・区間線形オートエンコーダ「SPAE」を開発し、がん細胞周期の遷移予測や細胞周期効果の除去を可能にしたことを報告しています。

Yi, J., Liu, J., Guo, P., Ye, Y.-n., zhou, X.2026-03-08💻 bioinformatics

REMAG: recovery of eukaryotic genomes from metagenomic data using contrastive learning

REMAG は、HyenaDNA 基盤モデルとコントラスト学習を活用して、長リードメタゲノムデータから高品質な真核生物 MAG を効率的に復元する新たなツールであり、既存の手法では困難だった真核生物ゲノムの断片化問題を解決します。

Gomez-Perez, D., Raguideau, S., Warring, S., James, R., Hildebrand, F., Quince, C.2026-03-08💻 bioinformatics

geneSTRUCTURE: A Modern Platform for Visualization of Gene Structures

本研究は、GFF3 および GTF 形式の注釈データに基づき、ユーザー定義のオーバーレイ注釈やインタラクティブなレイアウト調整を可能にするコマンドラインおよび Web ベースの可視化ツール「geneSTRUCTURE」を開発し、複雑な遺伝子構造の解析と効果的な結果提示を支援するものである。

Hashimoto, S., Yamada, K., Izawa, T.2026-03-08💻 bioinformatics

Telomere-to-telomere assembly and haplotype analysis of tetraploid Dendrobium officinale illuminate Orchidaceae polyploid evolution and mycorrhizal symbiosis genes

この論文は、ラン科初となるテロメア・ツー・テロメア(T2T)レベルの完全ゲノムアセンブリとハプロタイプ解析を通じて、Dendrobium officinale の四倍体化の進化史と、菌根共生に関与する SWEET 遺伝子ファミリーの機能を解明したものである。

Chen, E., Xu, J., Liu, Y., Li, Y., Feng, Y., Lu, Q., Ding, X., Niu, Z., Qin, S., Niu, S., Luo, Y., Guo, X., Luo, X.2026-03-07💻 bioinformatics

Multi-Target In Silico Investigation of Withaferin A as a Potential Antiviral Inhibitor Against Key Marburg Virus Proteins

この研究は、構造ベースのドラッグディスカバリー手法を用いて、マルブルグウイルスの主要タンパク質(VP35 および NP)に対して、Withaferin A が分子ドッキング、分子動力学シミュレーション、MM-GBSA 解析を通じて安定した結合親和性と多標的阻害活性を示すことを明らかにし、同化合物の抗ウイルス治療薬としての可能性を分子レベルで示唆しています。

Zinnah, K. M. A., Nabil, F. A., Darda, A., Islam, E., Hossain, F. M. A.2026-03-07💻 bioinformatics