バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Pioneer and Altimeter: Fast Analysis of DIA Proteomics Data Optimized for Narrow Isolation Windows

本研究は、狭い分離ウィンドウを用いた高速なデータ非依存取得(DIA)プロテオミクスデータの分析を可能にするオープンソースツール「Pioneer」と「Altimeter」を開発し、分離ウィンドウ効果を明示的にモデル化することで、既存の手法よりも 2〜6 倍高速かつ高信頼性の同定・定量を実現したことを報告しています。

Wamsley, N. T., Wilkerson, E. M., Major, M. B., Goldfarb, D.2026-02-19💻 bioinformatics

Experimental Time Points Guided Transcriptomic Velocity Inference

実験的な時間点を半教師あり学習で活用し、細胞の転写速度と内在的な時間を高精度に再構築する半教師あり学習フレームワーク「CellDyc」を開発し、発生・疾患・リプログラミングの文脈における細胞動態の解明を可能にした。

Zang, X., Shu, X., Zhang, N., Wu, Y., Deng, M., Zhou, X., Yang, J., Zhang, C.-Y., Wang, X., Zhou, Z., Wang, J.2026-02-19💻 bioinformatics

Identification of an ERCC2 mutation associated mutational signature of nucleotide excision repair deficiency in targeted panel sequencing data

本論文は、限られた遺伝子パネルシーケンシングデータから膀胱癌の ERCC2 変異に伴うヌクレオチド切除修復欠損の突然変異シグネチャを同定・検証し、このシグネチャが高い ERCC2 野生型腫瘍がプラチナ剤治療への反応性や生存率で優れていること、および他の固形癌でも同様のシグネチャが見られることを示すことで、ERCC2 変異腫瘍の新たな治療戦略を提案しています。

Stojkova, O., Borcsok, J., Sztupinszki, Z., Diossy, M., Prosz, A., Neil, A., Mouw, K. W., Sorensen, C. S., Szallasi, Z.2026-02-19💻 bioinformatics

NanoHIVSeq: A Long-Read Bioinformatics Pipeline for High-Throughput Processing of HIV Env Sequences

本論文は、UMI(ユニーク分子識別子)を不要とし、Oxford Nanopore 技術の長リードデータから HIV-1 環境遺伝子の機能的な変異を高精度に復元する新規バイオインフォマティクスパイプライン「NanoHIVSeq」を開発し、その高い再現性と精度を実証したものである。

Sheng, Z., Xiao, Q., Qiao, Y., Lu, H., McWhirter, J., Sagar, M., Wu, X.2026-02-19💻 bioinformatics

Benchmarking Large Language Models for Predicting Therapeutic Antisense Oligonucleotide Efficacy

本論文は、SMILES 表現や DNA 配列を用いたファインチューニングおよびプロンプトエンジニアリングを通じて、LLM が抗 sense オリゴヌクレオチド(ASO)の治療効果を予測する能力をベンチマークし、DNA 配列とターゲット遺伝子情報を組み合わせた少量ショット学習が GPT-3.5-Turbo などで高い予測精度(R²約 0.63)を達成したことを示しています。

Wei, Z., Griesmer, S., Sundar, A.2026-02-19💻 bioinformatics

A Machine Learning and Benchmarking Approach for Molecular Formula Assignment of Ultra High-Resolution Mass Spectrometry Data from Complex Mixtures

本論文は、超高分解能質量分析データから複雑な混合物の分子式を割り当てるために、k 近傍法や決定木回帰などの機械学習手法を適用し、従来の手法と比較して約 43% 多くの分子式を同定できることを実証するとともに、関連するデータセットとコードを公開して新たなベンチマークを確立したものである。

Shabbir, B., Oliveira, P. B., Fernandez-Lima, F., Saeed, F.2026-02-19💻 bioinformatics

ModCRElib: A standalone package to model cis-regulatory elements.

本論文は、転写因子とDNAの相互作用や高次調節複合体の構造をモデル化し、結合親和性や結合部位を予測するためのスタンドアロンパッケージ「ModCRElib」の機能と、その5つの具体的な応用例を紹介するものである。

Gohl, P., Fornes, O., Bota, P. M., Messeguer, A., Bonet, J., Molina-Fernandez, R., Planas-Iglesias, J., Hernandez, A. C., Gallego, O., Fernandez-Fuentes, N., Oliva, B.2026-02-19💻 bioinformatics

A single-cell atlas linking intratumoral states to therapeutic vulnerabilities across cancers

本研究は、180 万件の単細胞トランスクリプトームデータを統合した「治療がん細胞アトラス(TCCA)」を構築し、腫瘍内異質性がゲノム多様性ではなく機能的転写プログラムや腫瘍微小環境の状態によって駆動されることを明らかにすることで、がんのサブクローン状態と薬物感受性を結びつけ、精密腫瘍学における治療戦略の最適化を可能にする包括的な枠組みを提供しています。

Gonzalez-Bermejo, M., Serrano-Ron, L., Garcia-Martin, S., Lapuente-Santana, O., Sanz-Portillo, I., Gonzalez-Martinez, P., Gomez-Lopez, G., Al-Shahrour, F.2026-02-19💻 bioinformatics

In silico degradomics reveals disease- and endotype-specific alterations in the joint tissue landscape

本研究は、臨床プロテオミクスデータから新規の「DegrAID」と呼ばれる計算機パイプラインを開発し、関節疾患やそのエンドタイプ(骨髄系とリンパ系)に特異的な細胞外マトリックスの分解パターンを解明することで、組織リモデリングのメカニズムと治療反応性の違いに関する新たな洞察を提供した。

Hoyle, A., Midwood, K. S.2026-02-19💻 bioinformatics