バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Relationship Between Gene Expression and Drug Response in Triple-Negative Breast Cancer: Leveraging Single-Cell RNA Sequencing and Machine Learning to Identify Biomarker Profiles

本論文は、単一細胞 RNA シーケンシングと解釈可能な機械学習を統合することで、トリプルネガティブ乳がんの薬剤応答を予測する新たなバイオマーカーを同定し、個別化治療戦略への臨床的示唆を提供した。

Mohammadi, K., Afhami, N., Saniotis, A., Henneberg, M., Bagheri, M., Kavousi, K.2026-03-08💻 bioinformatics

Deciphering Cell Cycle Dynamics and Cell States in Single-cell RNA-seq data with SPAE

本論文は、単一細胞 RNA シーケンシングデータにおける細胞周期動態と細胞状態の解析精度と頑健性を大幅に向上させる統合型正弦波・区間線形オートエンコーダ「SPAE」を開発し、がん細胞周期の遷移予測や細胞周期効果の除去を可能にしたことを報告しています。

Yi, J., Liu, J., Guo, P., Ye, Y.-n., zhou, X.2026-03-08💻 bioinformatics

REMAG: recovery of eukaryotic genomes from metagenomic data using contrastive learning

REMAG は、HyenaDNA 基盤モデルとコントラスト学習を活用して、長リードメタゲノムデータから高品質な真核生物 MAG を効率的に復元する新たなツールであり、既存の手法では困難だった真核生物ゲノムの断片化問題を解決します。

Gomez-Perez, D., Raguideau, S., Warring, S., James, R., Hildebrand, F., Quince, C.2026-03-08💻 bioinformatics

PROTOTYPE-BASED CONTINUAL LEARNING FOR SINGLE-CELL ANNOTATION

本論文は、過去のデータを再参照することなく細胞タイプの知識を継続的に蓄積・更新し、多様なプラットフォームや組織、モダリティにわたって高い精度と汎化性能を実現する新たな単一細胞注釈フレームワーク「scEvolver」を提案し、炎症性腸疾患における上皮細胞のメタプラスティックな遷移の発見などを通じて複雑な疾患環境における細胞動態の解明に貢献することを示しています。

Ge, S., He, Q., Ren, Y., Xu, Y., Wang, M., Nie, Z., Xu, H., Cheng, Q., Sun, S., Ren, Z.2026-03-08💻 bioinformatics

geneSTRUCTURE: A Modern Platform for Visualization of Gene Structures

本研究は、GFF3 および GTF 形式の注釈データに基づき、ユーザー定義のオーバーレイ注釈やインタラクティブなレイアウト調整を可能にするコマンドラインおよび Web ベースの可視化ツール「geneSTRUCTURE」を開発し、複雑な遺伝子構造の解析と効果的な結果提示を支援するものである。

Hashimoto, S., Yamada, K., Izawa, T.2026-03-08💻 bioinformatics

Genomic language models improve cross-species gene expression prediction and accurately capture regulatory variant effects in Brachypodium mutant lines

本研究は、文脈を考慮した DNA 配列埋め込みを活用した深層学習モデルを開発し、17 種の植物における遺伝子発現予測の精度向上と、特に Brachypodium 変異系統における単一塩基変異の効果を従来モデルを凌駕して正確に捉えることを実証しました。

Vahedi Torghabeh, B., Moslemi, C., Dybdal Jensen, J., Hentrup, S., Li, T., Yu, X., Wang, H., Asp, T., Ramstein, G. P.2026-03-07💻 bioinformatics

Re-analysis of Transcriptomic and Proteomic Data Using Multi-Omics Approaches Identifies Biomarkers of Diabetes-Associated Complications in an INS Mutant Pig Model

INS 変異豚モデルを用いたトランスクリプトームとプロテオームの統合再解析により、糖尿病合併症の新たなバイオマーカーとして ADAMTS17 が同定され、ECM と免疫系の相互作用を介した免疫機能不全や創傷治癒の遅延との関連が示唆されました。

Kota, K. P., Abbasi, B. A., Kajla, P., Tripathi, S., Bailey, A., Varma, B.2026-03-07💻 bioinformatics

Inverse Protocol Prediction from Spheroid Microscopy Imaging via Morphology-Aware Structured Learning

本論文は、3D 細胞培養の球形体画像から実験条件を推定する「逆プロトコル予測」タスクに対し、形態情報と深層視覚特徴を融合し、プロトコル間の依存関係を考慮した階層型マルチタスクトランスフォーマーを用いた新しい学習フレームワークを提案し、高い精度で実験プロトコルの再現を可能にする手法を開発したものである。

Mittal, P., Srivastava, A., Chauhan, J.2026-03-07💻 bioinformatics

SR2P: an efficient stacking method to predict protein abundance from gene expression in spatial transcriptomics data

SR2P は、11 の予測モデルを統合するスタッキング機械学習フレームワークであり、空間トランスクリプトミクスデータからタンパク質発現量を高精度に推定することで、マルチオミクスデータが限られる状況下でも腫瘍免疫研究を可能にします。

Wang, Q., Gao, A., Li, Y., Khatri, P., Hu, R., Huang, J., Pawitan, Y., Vu, T. N., Dinh, H. Q.2026-03-07💻 bioinformatics