バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Correlation Between Information Entropy and Functions of Gene Sequences in the Evolutionary Context: A New Way to Construct Gene Regulatory Networks from Sequence

この論文は、シャノンエントロピーや進化保存性などの情報理論的アプローチを統合した新しい枠組みを提案し、DNA 配列データから直接遺伝子制御ネットワークを構築する手法を確立することを目的としています。

Pan, L., Chen, M., Tanik, M.2026-04-07💻 bioinformatics

STDrug enables spatially informed personalized drug repurposing from spatial transcriptomics

STDrug は、空間トランスクリプトミクス、グラフベースのモデリング、マルチモーダル学習を統合して、腫瘍微小環境を考慮した患者固有の創薬候補を優先順位付けし、既存手法を上回る予測精度で肝細胞癌や前立腺癌における治療的発見を加速する新しい計算フレームワークです。

Yang, Y., Unjitwattana, T., Zhou, S., Kadomoto, S., Yang, X., Chen, T., Karaaslanli, A., Du, Y., Zhang, W., Liang, H., Guo, X., Keller, E. T., Garmire, L. X.2026-04-07💻 bioinformatics

Representation Methods of Transcriptomics with Applications in Neuroimmune Biology

本論文は、マイクログリアの複雑な転写状態を従来の細胞アイデンティティの定義ではなく、文脈に応じて活性化・調節される共発現モジュール(分子プログラム)として捉える共発現ネットワーク解析が、より合理的なモデルを提供することを示しています。

Abbasi, M., Ochoa Zermeno, S., Spendlove, M. D., Tashi, Z., Plaisier, C. L., Bartelle, B. B.2026-04-07💻 bioinformatics

Locat: Joint enrichment and depletion testing identifies localized marker genes in single-cell transcriptomics

単細胞トランスクリプトミクスデータにおいて、候補集団内での遺伝子発現の富化だけでなく、その外部での枯渇も同時に検定する「Locat」という新しい枠組みを提案し、これにより細胞集団を明確に区別する高特異的な局在マーカー遺伝子を同定し、バッチ補正なしに異なる条件間での比較を可能にすることを示しています。

Lewis, W. R., Aizenbud, Y., Strino, F., Kluger, Y., Parisi, F.2026-04-07💻 bioinformatics

A Context-Aware Single-Cell Proteomics Analysis pipeline.

この論文は、単一細胞プロテオミクスデータの特性に特化した品質管理やバッチ補正、そして構造的な矛盾推論と直交データ検証を組み合わせた大規模言語モデルを用いた文脈認識型アノテーションにより、再現性が高く解釈可能な分析パイプライン「CASPA」を開発し、その有効性を複数の生体サンプルで実証したものである。

Salomo Coll, C., Makar, A. N., Brenes, A. J., Inns, J., Trost, M., Rajan, N., Wilkinson, S., von Kriegsheim, A.2026-04-07💻 bioinformatics

FunctionaL Assigning Sequence Homing (FLASH) maps phenotype to sequence with deep and machine learning

本研究は、35,000 以上の細菌・真菌・ウイルスの分離株において、既知の変異だけでなく未見の変異や構造変異に対しても高い精度で表現型を予測し、従来の GWAS や既存の機械学習手法を超える解釈可能な深層学習フレームワーク「FLASH」を提案しています。

Cotter, D. J., Harrison, M.-C., Rustagi, A., Wang, P. L., Kokot, M., Carey, A. F., Deorowicz, S., Salzman, J.2026-04-07💻 bioinformatics

DrugPlayGround: Benchmarking Large Language Models and Embeddings for Drug Discovery

本論文は、創薬における仮説生成や候補化合物の選定などを加速する大規模言語モデル(LLM)の性能を客観的に評価し、その限界と利点を明らかにするため、物理化学的特性や薬物相互作用、生理的反応などの記述生成および専門家の検証を通じて推論能力をテストする新たなベンチマークフレームワーク「DrugPlayGround」を提案するものである。

Liu, T., Jiang, S., Zhang, F., Sun, K., Head-Gordon, T., Zhao, H.2026-04-07💻 bioinformatics