バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

pertTF: context-aware AI modeling for genome-scale and cross-system perturbation prediction

本研究は、ヒト膵臓発生およびβ細胞分化における 30 種類の遺伝子ノックアウトと 14 種類の細胞タイプからなる大規模データを用いて学習したトランスフォーマーベースの AI モデル「pertTF」を開発し、未見の遺伝子や細胞文脈における遺伝子摂動による発現変化だけでなく、細胞アイデンティティや集団構成の変化といった表現型も高精度に予測可能であることを示しました。

Su, Y., Liu, D., Menon, V., Song, B., Boccara, S., Zhang, N., Zhao, H., Zhao, J. H., Wang, L., Hu, N., Nzima, M., Katz, A., Swargam, B. K., Ament, S. A., Diao, Y., Zhang, H., Chao, L., Hon, G., Huangf (…)2026-03-16💻 bioinformatics

Reinforcement Learning for Antibiotic Stewardship: Optimizing Prescribing Policies Under Antimicrobial Resistance Dynamics

本論文は、抗菌薬耐性(AMR)の動的変化と部分観測性の下での処方戦略を最適化するため、階層的強化学習が不確実性下での抗菌薬適正使用の政策分析において有効であることを示すシミュレーションフレームワーク「abx_amr_simulator」を開発し、その有用性を検証したものである。

Lee, J., Blumberg, S.2026-03-16💻 bioinformatics

Reliable Molecular Retrieval from Mass Spectra using Conformal Prediction

本論文は、コンフォーマル予測を適用することで、質量スペクトルごとの分子構造同定候補リストに「真の分子が含まれる確率」を保証し、分布シフト下でも信頼性と効率性のバランスを制御可能な手法を提案し、MassSpecGym ベンチマークでその有効性を検証したものである。

Rakhshaninejad, M., De Waele, G., Jürgens, M., Waegeman, W.2026-03-16💻 bioinformatics

A new pipeline for cross-validation fold-aware machine learning prediction of clinical outcomes addresses hidden data-leakage in omics based 'predictors'.

この論文は、オミクスデータ解析における標準的な検証手法が引き起こす潜在的なデータリーク問題を解決し、各クロスバリデーションフォールド内でグローバル特徴量を独立して再計算することで厳密なデータ分離を実現する新しい機械学習パイプライン「pipeML」を提案し、その有効性を実証しています。

Hurtado, M., Pancaldi, V.2026-03-16💻 bioinformatics

Personalized Morphology, Replication Timing, and RNA based Gene Expression Networks for Basal-like and Classical subtyping genes in Pancreatic Adenocarcinoma

本論文は、膵管腺癌の基底様型と古典的亜型の個別化遺伝子ネットワーク解析において、メチル化データから推定した複製タイミングと形態的特徴を統合することで、従来の RNA 発現データのみでは得られなかった臨床的に意義のある遺伝子制御構造を捉え、サブタイプ分類の精度とネットワークの頑健性を向上させたことを示しています。

Leyva, A., Niazi, M. K. K.2026-03-16💻 bioinformatics

AetherCell: A generative engine for virtual cell perturbation and in vivo drug discovery

本研究は、臨床データと実験データを統合する生成基盤モデル「AetherCell」を開発し、これによりヒトの生体内環境における薬剤応答や遺伝子操作を高精度に予測・再現し、乾性角結膜炎や潰瘍性大腸炎に対する新規薬物候補の発見に成功したことを報告しています。

Xie, Z., Li, W., Chen, Y., Peng, Z., Xiang, L., Wang, D.2026-03-16💻 bioinformatics

DCS Tools: A high-performance, resource-efficient and scalable computing suite for population-scale genomic analysis and data compression

DCS Tools は、GPU や FPGA などの専用ハードウェアを必要とせず、標準的な CPU 環境で従来のパイプラインより 16 倍高速な処理と、FASTQ および VCF ファイルの大幅な圧縮を実現することで、大規模な集団ゲノム解析における計算リソースとストレージのボトルネックを解決する高効率かつスケーラブルな計算スイートです。

Gong, C., Yuan, D., Zhao, Z., Chen, Y., Yang, Q., Wan, R., Li, S., Zhang, Y.2026-03-16💻 bioinformatics