バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

CLOP-DiT: Structured-Metadata-Conditioned Single-Cell Latent Generation via Contrastive Language-Omics Pretraining and Diffusion Transformers

本論文は、構造化された生物学的記述(細胞種、組織、マーカー遺伝子など)から単細胞遺伝子発現プロファイルを生成する新しいパイプライン「CLOP-DiT」を提案し、テキストと細胞データの対照的アライメントと拡散トランスフォーマーを用いた条件付き生成の可行性を実証したものである。

Fu, Z.2026-03-30💻 bioinformatics

Cellector: A tool to detect foreign genotype cells in scRNAseq data with applications in leukemia and microchimerism.

この論文は、移植後の白血病患者における微小残存病変(MRD)やマイクロキメリズムなどの研究において、単一細胞 RNA シーケンスデータから極めて稀な外来遺伝子型細胞(0.05% 以下)を検出するための計算手法「Cellector」を提案し、その高い精度を実証したものである。

Heaton, H., Behboudi, R., Ward, C., Weerakoon, M., Kanaan, S., Reichle, S., Hunter, N., Furlan, S.2026-03-30💻 bioinformatics

MAAMOUL: Metabolic network-based discovery of microbiome-metabolome shifts in disease

この論文は、メタゲノムデータとメタボロームデータを統合し、既知の代謝ネットワークを活用して疾患特異的な微生物代謝モジュールを同定する計算フレームワーク「MAAMOUL」を提案し、炎症性腸疾患や過敏性腸症候群において従来の手法では見逃されていた機能的な変化を明らかにしたことを報告しています。

Muller, E., Baum, S., Borenstein, E.2026-03-30💻 bioinformatics

DualLoc: Full-parameter fine-tuning of cascaded dual transformers for protein subcellular localization prediction

本研究は、タンパク質の多重的な細胞内局在を高精度に予測するために、カスケード型デュアル・トランスフォーマー構造を用いたフルパラメータ微調整モデル「DualLoc」を開発し、既存手法を上回る性能と生物学的に妥当な細胞区画間の相関を明らかにしたことを報告しています。

Chen, Y. G., Chung, W.-Y., Chang, K. Y.2026-03-30💻 bioinformatics

Clinical evidence yield as a framework for evaluating computational predictors and multiplexed assays of variant effect

この論文は、変異影響予測ツールやマルチプレックスアッセイの臨床的有用性を従来の識別指標ではなく、ACMG/AMP ガイドラインに基づく「平均証拠強度(MES)」という新たな定量的指標を用いて評価する枠組みを提案し、MAVEs や CPT-1 などの手法が VUS(意義不明変異)の解釈において高い臨床証拠を提供できることを示しています。

Shang, Y., Badonyi, M., Marsh, J. A.2026-03-30💻 bioinformatics

ALPINE: A Scalable Pipeline for Comprehensive Classification of Gene-Editing Outcomes from Long-Read Amplicon Sequencing

CRISPR 遺伝子編集の長リードアンプリコンシーケンシングデータから、ベクター統合や構造変異を含む多様な編集結果を包括的に分類・定量化するスケーラブルなパイプライン「ALPINE」を開発し、その高精度と臨床応用への有用性を示しました。

Chen, Y., Gao, X.-H., Vichas, A., Wang, J., Golhar, R., Neuhaus, I.2026-03-30💻 bioinformatics

Deciphering sepsis molecular subtypes using large-scale data to identify subtype-specific drug repurposing

本論文は、大規模な転写組データを用いて敗血症を免疫および代謝特性に基づき 4 つの分子サブタイプに分類し、各サブタイプに特異的な遺伝子シグネチャを同定することで、メチレンブルーやモノクローナル抗体など、従来の臨床試験の失敗要因を説明しつつ個別化医療を実現する可能性のある薬剤転用候補を特定したことを示しています。

Smith, L. A., Augustin, B., Jacob, V., Black, L. P., Bertrand, A., Hopson, C., Cagmat, E., Datta, S., Reddy, S., Guirgis, F., Graim, K.2026-03-30💻 bioinformatics