バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

GAE-Δ: A Graph-Learning Framework for Gene Network Rewiring and Clinical Outcome Prediction from Multi-Omics Data

GAE-Δフレームワークは、グラフオートエンコーダを活用してマルチオミクスデータにおける表現型特異的な遺伝子ネットワークの再編成をモデル化し、既存の線形因子分解法およびネットワークベースの手法と比較して、優れた臨床転帰予測を達成するとともに、生物学的に意味のあるがん駆動因子を同定する。

Tang, Z., Chen, Z., Chen, M., Wang, Y., Ennis, S., Niranjan, M., Ewing, R.2026-05-26💻 bioinformatics

Decoding Multicellular Communication Motifs from Spatial Transcriptomics with ALARMIST

本論文は、空間トランスクリプトミクスデータから解釈可能な多細胞間コミュニケーションモチーフを解読し、高次シグナリングパターンとその下流の表現型への影響を同定する確率的フレームワーク「ALARMIST」を導入し、肺腺がんおよび膠芽腫における腫瘍進行の微小環境駆動因子の解明におけるその有用性を示している。

Fan, J., Hood, J., Strong, J., Quinn, J. F., Dai, Y., Data Science TeamLab,, Schein, A., Yu, K. K. H., Tansey, W.2026-05-26💻 bioinformatics

Integrated optimization of experimental and computational workflows improves genome recovery in long-read gut metagenomics

本論文は、短鎖リードシーケンシングの限界を克服し、長鎖リード腸内メタゲノム解析からの完全な微生物ゲノムの回収を大幅に改善するために、実験的なサンプル処理と計算機によるアセンブリワークフローを統合した、CycloneSEQ プラットフォームの体系的な最適化を提示する。

Hu, Y., Sun, L., Huang, Y., Jiang, F., Tong, X., Yang, J., Ju, Y., Yang, Z., Liufu, S., Hu, Y., Ma, W., Guo, R., Li, W., Zhang, T., Zhu, X., Zhang, Z.2026-05-26💻 bioinformatics

Characterizing homology-induced data leakage and memorization in genome-trained sequence models

本論文は、相同性によって引き起こされるデータリーケージが、モデルに汎化可能な原理ではなく記憶された関連性に依存させることで、ゲノム学習シーケンスモデルの性能を体系的に過大評価することを明らかにし、より信頼性の高い評価とモデルの汎化性能の向上を実現するための相同性認識データ分割を可能にする hashFrag ツールを提案する。

Rafi, A. M., Kiyota, B., Yachie, N., de Boer, C. G.2026-05-25💻 bioinformatics

Time-Resolved Phosphoproteomics-Guided BFS Beam Search Reveals Cell-Type-Specific EGFR Signaling Architectures and SHP2 Inhibitor-Induced Pathway Rewiring

本研究は、時間分解フォスホプロテオミクスとBFS 誘導ビームサーチアルゴリズムを統合した体系的な計算フレームワークを導入し、細胞タイプ固有の EGFR シグナル伝達ネットワークを再構築することで、SHP2 阻害が経路アーキテクチャを再編成し適応性耐性メカニズムを駆動する仕組みを明らかにした。

Lee, H., Lee, G.2026-05-23💻 bioinformatics

Interpreting Omics Data Analysis with Large Language Models for Disease Target and Drug Discovery

本論文は、スキーマ制約付き大規模言語モデルの検索と数値オミクスデータ解析を統合した、出所意識型テキスト・ツー・ターゲット・フレームワークを導入し、アルツハイマー病と膵管腺がんで顕著な検証を示す、解釈可能で監査準備が整った疾患ターゲットおよび創薬戦略を生成するものである。

XU, Z., Chen, W., Ren, W., Xu, T., Amaechin, S., Khan, R., Chen, Y., Province, M., Payne, P., Li, F.2026-05-23💻 bioinformatics

Asymmetric Contrastive Objectives for Efficient Phenotypic Screening

本論文は、実験メタデータを学習されたクラスベクトルとして取り込む幾何学的に着想を得た SPC 変種を含む非対称な対照的目的関数を導入し、限られたデータと計算資源でも効果的でありながら、複数のデータセットと指標において先行手法を上回る表現を効率的に抽出し、表現型スクリーニングに適用するものである。

Nightingale, L., Tuersley, J., Warchal, S., Cairoli, A., Howes, J., Shand, C., Powell, A., Green, D., Strange, A., Howell, M.2026-05-22💻 bioinformatics

Rewriting protein alphabets with language models

本論文は、対照学習を介して言語モデルの埋め込みから導き出された新しい 20 文字のタンパク質アルファベット TEA を紹介するものであり、既存の配列探索アルゴリズムを活用しつつ、構造ベースの手法に匹敵する高速かつ高感度な遠縁相同性検出を可能にする。

Pantolini, L., Studer, G., Engist, L., Pudziuvelyte, I., Pommerening, F., Waterhouse, A. M., Bienert, S., Tauriello, G., Steinegger, M., Schwede, T., Durairaj, J.2026-05-22💻 bioinformatics

Widespread use of invalid statistical tests in biomedical machine learning

本論文は、生体医療機械学習において交差検証のフォールド依存性を無視した無効な統計的検定の広範な使用が偽陽性率の過大評価を招くことを明らかにし、これにより著者らは頑健な解決策としてSHARP検定を提案し、妥当なモデル比較のための新たな報告ガイドラインを提供する。

Zeng, T., Li, H., Zhang, S., Tan, Y. Q., Tian, F., Orban, C., An, L., Che, W., Cheng, J., Chong, J. S. X., Dehestani, N., Dong, Z., Li, X., Li, Z., Lim, M. J. R., Lin, Y., Ling, Q., Ling, Z., Low, X. (…)2026-05-22💻 bioinformatics