バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

CancerSTFormer enables multi-scale analysis of spot-resolution spatial transcriptomes and dissects the gene and immune regulatory responses of targeted therapies

この論文は、がんの空間的ニッチを多スケールで解析し、遺伝子操作や免疫チェックポイント阻害療法などの標的治療の影響を予測・解明するための新しい基盤モデル「CancerSTFormer」を提案し、既存のスポット分解能空間トランスクリプトームデータを治療抵抗性や感受性の理解に活用する手法を確立したことを報告しています。

Strope, B., Varghese, D., Bowie, W., Wang, S., Zhu, Q.2026-03-03💻 bioinformatics

The One Click Wonder: a retrained automated segmentation pipeline that enables quantitative and modular analysis of C. elegans embryos

この論文は、C. elegans 胚の核の多様性に対応するため Cellpose モデルを再学習させた自動セグメンテーションパイプライン「One Click Wonder (OCW)」とスポット検出を統合した「BAAM」を開発し、これにより単一細胞レベルでの遺伝子発現の定量的かつモジュール化された高スループット解析を可能にしたことを報告しています。

Bassett, P. C., Verheijen, T. E., Angonezi, A. L., Andriollo, A., Herbert, S., Roth, G., Chao, J., Mango, S. E.2026-03-03💻 bioinformatics

STCS: A Platform-Agnostic Framework for Cell-Level Reconstruction in Sequencing-Based Spatial Transcriptomics

本論文では、Visium HD や Stereo-seq などの高解像度空間トランスクリプトームデータから、核セグメンテーションと距離モデルを統合することで参照データなしに細胞レベルの遺伝子発現プロファイルを再構築し、既存手法を上回る精度で生物学的に整合した構造を維持する汎用的なフレームワーク「STCS」を提案しています。

Chen Wu, L., Hu, X., Zhan, F., Sun, C., Gonzales, J., Ofer, R., Tran, T., Verzi, M. P., Liu, L., Yang, J.2026-03-03💻 bioinformatics

snputils: A High-Performance Python Library for Genetic Variation and Population Structure

本論文は、大規模な遺伝子データ解析における形式非互換性や計算効率の課題を解決し、生物銀行規模の研究に適した高効率な I/O、変換、統計解析機能を統合したオープンソースの Python ライブラリ「snputils」を紹介するものである。

Bonet, D., Comajoan Cara, M., Barrabes, M., Smeriglio, R., Agrawal, D., Aounallah, K., Geleta, M., Dominguez Mantes, A., Thomassin, C., Shanks, C., Huang, E. C., Franquesa Mones, M., Luis, A., Saurina (…)2026-03-03💻 bioinformatics

A comprehensive assessment of tandem repeat genotyping methods for Nanopore long-read genomes

本論文は、オックスフォード・ナノポア技術を用いたタンデムリピート遺伝子型決定ツールの包括的な評価を行い、単なる長さの精度だけでなく配列レベルの精度や実用性を多角的に検証した結果、特定のツールが全領域で優れているわけではないものの、配列レベルの評価が臨床診断や集団研究における適切なツール選定に不可欠であることを示した。

Aliyev, E., Avvaru, A., De Coster, W., Arner, G. M., Nyaga, D. M., Gibson, S. B., Weisburd, B., Gu, B., Gonzaga-Jauregui, C., 1000 Genomes Long-Read Sequencing Consortium,, Chaisson, M. J. P., Miller (…)2026-03-03💻 bioinformatics

Large-Scale Statistical Dissection of Sequence-Derived Biochemical Features Distinguishing Soluble and Insoluble Proteins

7 万 8 千以上のタンパク質を対象とした大規模統計解析により、可溶性と不溶性タンパク質を区別する配列由来の生化学的特徴は、サイズや負電荷残基の割合など少数の弱く相関した信号によって支配され、その情報次元が本質的に低いことが明らかにされました。

Vu, N. H. H., Nguyen Bao, L.2026-03-03💻 bioinformatics

The limits of Bayesian estimates of divergence times in measurably evolving populations

この論文は、異時系列データを用いた分岐年代推定において、無限データ条件下でも不確実性が絶対年代ではなく最も近い既知の年代(較正点)との距離に比例して増加し、かつウイルスのような実データでは無限サイト挙動を示さないため、データ量や情報量に依存した理論的な不確実性の下限を確立したことを示しています。

Ivanov, S., Fosse, S., dos reis, M., Duchene, S.2026-03-03💻 bioinformatics

Phenotypic Bioactivity Prediction as Open-set Biological Assay Querying

本研究は、化合物の細胞画像とアッセイの自然言語記述を統合したマルチモーダル基盤モデル「OpenPheno」を提案し、従来の閉じたセットの枠組みを超えて、ラベル付きデータなしで未知の生物アッセイに対する化合物の生物活性をゼロショットで高精度に予測できる新たな創薬パラダイムを実現したものである。

Sun, Y., Zhang, X., Zheng, Q., Li, H., Zhang, J., Hong, L., Wang, Y., Zhang, Y., Xie, W.2026-03-03💻 bioinformatics