バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Cross-etiology transcriptomic conservation in hepatocellular carcinoma reveals opposing proliferation and hepatocyte-loss programs validated across cohorts

この論文は、肝細胞癌(HCC)において、異なる病因に共通して増殖と肝細胞機能喪失という相反するトランスクリプトミクスプログラムが存在し、特に HBV 関連腫瘍では細胞周期とは独立した損傷関連成分が維持されていることを、複数のコホートで検証された統合スコアを用いて明らかにしたものである。

Romero, R., Toledo, C.2026-03-13💻 bioinformatics

Learning the All-Atom Equilibrium Distribution of Biomolecular Interactions at Scale

本論文は、従来の分子動力学法よりもはるかに効率的かつ高精度にタンパク質 - リガンドの全原子平衡分布をサンプリングできる、1500 万を超えるコンフォメーションを含む大規模データセットで学習された生成モデル「AnewSampling」を提案し、生体分子の動的相互作用の理解と設計を加速するものである。

Wang, Y., Xu, Y., Li, W., Yu, H., Tan, W., Li, S., Huang, Q., Chen, N., Wu, X., Wu, Q., Liu, K.2026-03-13💻 bioinformatics

Fast and accurate resolution of ecDNA sequence using Cycle-Extractor

この論文は、短鎖および長鎖リードのシーケンスデータからがんにおけるエクストラクロモソーム DNA(ecDNA)の構造を高速かつ高精度に再構築する新しいツール「Cycle-Extractor」を開発し、既存手法と比較して大幅な高速化と、特に長鎖リードを用いた場合のより完全な構造解明の実現を報告しています。

Faizrahnemoon, M., Luebeck, J., Hung, K. L., Rao, S., Prasad, G., Tsz-Lo Wong, I., G. Jones, M., S. Mischel, P., Y. Chang, H., Zhu, K., Bafna, V.2026-03-13💻 bioinformatics

MetaResNet: Enhancing Microbiome-Based Disease Classification through Colormap Optimization and Imbalance Handling

本研究は、メタゲノムデータの疾病分類において、SMOTE による不均衡データ処理と Jet カラーマップの最適化を組み合わせたカスタム CNN「MetaResNet」を開発し、既存手法を統計的に上回る高い診断精度を達成したことを示しています。

Qureshi, A., Wahid, A., Qazi, S., Khattak, H. A., Hussain, S. F.2026-03-13💻 bioinformatics

Context-dependent genetic regulation of gene expression in pigs

この研究は、ブタの多組織データを用いた分位回帰解析により、標準的な線形回帰では検出できない文脈依存的な遺伝子発現調節(eQTL)を特定し、これらが遠隔調節領域や 3 次元ゲノム構造と関連し、ヒトの疾患関連遺伝子の調節メカニズム解明にも寄与することを示しました。

Wang, F., Wang, C., Teng, J., Fang, L., Ionita-Laza, I.2026-03-13💻 bioinformatics

EoRNA2: Autonomous Data Discovery and Processing for Databasing of Gene Expression Data

この論文は、2021 年に発表された大麦の遺伝子発現データベース「EoRNA」の大幅な更新版「EoRNA2」を紹介し、自動化されたワークフローによるサンプル数の飛躍的増加、新参照転写セットの構築、そして他生物種への再利用を可能にする汎用的なインフラの公開など、その主要な機能と特徴を述べています。

Milne, L., Simpson, C. G., Guo, W., Mayer, C.-D., Milne, I., Bayer, M.2026-03-13💻 bioinformatics

DNA-MGC+: A versatile codec for reliable and resource-efficient data storage on synthetic DNA

この論文は、合成 DNA のデータ保存において、合成・増幅・シーケンシングに伴うノイズや欠落を克服し、既存のコーデックを上回る信頼性と資源効率を実現する新しいコーデック「DNA-MGC+」を提案し、Illumina および Nanopore 両方のシーケンシング技術を用いた広範な評価でその優位性を実証したものである。

Khabbaz, R., Mateos, J., Antonini, M., Kas Hanna, S.2026-03-13💻 bioinformatics

BioPipelines: Accessible Computational Protein and Ligand Design for Chemical Biologists

実験中心の化学生物学研究室でも、深層学習を活用したタンパク質やリガンドの設計ワークフローを容易に構築・実行できるよう、30 以上のツールを統合し、インタラクティブなプロトタイピングから大規模な本番実行までをシームレスに支えるオープンソースの Python フレームワーク「BioPipelines」が提案されています。

Quargnali, G., Rivera-Fuentes, P.2026-03-13💻 bioinformatics