bioinformatics 件の論文

バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Evaluating Limits of Machine Learning-Assisted Raman Spectroscopy in Classification of Biological Samples

本論文は、機械学習支援ラマン分光法における分類精度が、使用するアルゴリズムよりもむしろノイズやスペクトルの類似性、生物学的なばらつき、および機器の較正といった実験的要因によって主に制限されることを実証し、高精度な分類を実現するにはデータ品質の向上と実験条件の厳密な管理が不可欠であることを示しています。

Yadav, A., Birkby, A., Armstrong, N., Arnob, A., Chou, M.-H., Fernandez, A., Verhoef, A. J., Yi, Z., Gulati, S., Kotnis, S., Sun, Q., Kao, K. C., Wu, H.-J.2026-03-01💻 bioinformatics

Information Leakage in Enzyme Substrate Prediction

本論文は、酵素と基質の相互作用予測において広く用いられているデータセットおよびモデルに情報漏洩が存在し、これを除去するとモデルの性能がほぼランダムレベルまで低下することを明らかにしている。

Atabaigi Elmi, V., Joeres, R., Kalinina, O. V.2026-03-01💻 bioinformatics

MolX: A Geometric Foundation Model for Protein-Ligand Modelling

本論文は、300 万を超えるタンパク質ポケットと 500 万を超える分子の 3D 構造データから学習した E(3) 等変性グラフトランスフォーマー「MolX」を提案し、タンパク質とリガンドの相互作用を幾何学的・化学的に統合的にモデル化することで、創薬タスクにおける最先端の性能と解釈可能性を実現したものである。

Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.2026-03-01💻 bioinformatics

Achieving spatial multi-omics integration from unaligned serial sections with DIME

本論文は、異なるオミクスモダリティからの連続切片データにおける「対角統合」の問題を解決するため、高信頼領域のアンカー付けと最適輸送に基づくハイブリッド整合戦略を採用した深層学習フレームワーク「DIME」を提案し、空間的マルチオミクスデータの統合表現学習を可能にするものです。

Sun, P., Huang, X., Mou, T., Zheng, X.2026-02-28💻 bioinformatics

SpatialCompassV (SCOMV): De novo cell and gene spatial pattern classification and spatially differential gene identification

本論文は、事前の生物学的知識に依存せず、遺伝子や細胞の空間的分布パターンをベクトル関係に基づいて分類し、空間的発現量だけでなく空間的配置の違いも検出する新たな計算ツール「SpatialCompassV (SCOMV)」を開発したことを報告しています。

Nomura, R., Sakai, S. A., Kageyama, S.-I., Tsuchihara, K., Yamashita, R.2026-02-28💻 bioinformatics

LRSomatic: a highly scalable and robust pipeline for somatic variant calling in long-read sequencing data

この論文は、PacBio HiFi および ONT 長鎖リード配列データから、体細胞変異（SNV、インデル、構造変異、コピー数変化）およびエピジェネティック情報を包括的かつ高スケーラブルに検出するための、Nextflow ベースの新しいパイプライン「LRSomatic」を開発し、その性能を参照細胞系およびがん症例で実証したことを報告しています。

Forsyth, R. A., Harbers, L., Verhasselt, A., Iraizos, A.-L. R., Yang, S., Vande Velde, J., Davies, C., Pillay, N., Lambrechts, L., Demeulemeester, J.2026-02-28💻 bioinformatics

Arborist: Prioritizing Bulk DNA Inferred Tumor Phylogenies via Low-pass Single-cell DNA Sequencing Data

この論文は、低深度の単細胞 DNA 配列データを用いてバルク DNA 配列データから推定された腫瘍系統樹の候補を優先順位付けし、より確実な腫瘍進化の再構築を可能にする新しい手法「ARBORIST」を提案し、その有効性をシミュレーションおよび実データで実証したものである。

Weber, L. L., Ching, C. Y., Ly, C., Pan, Y., Cheng, Y., Gao, C., Van Loo, P.2026-02-28💻 bioinformatics

Nanopore sequencing reaches amplicon sequence variant (ASV) resolution

本論文は、Oxford Nanopore 技術の精度向上により、従来の参照データベースへの依存や OTU クラスタリングを脱却し、250〜4,200 bp の範囲で直接 ASV（アンプリコンシーケンスバリアント）を生成して微生物叢を高分解能で解析することが可能になったことを実証しています。

Riisgaard-Jensen, M., Villanelo, S. A. R., Andersen, K. S., Kirkegaard, R., Hansen, S. H., Jiang, C., Stefansen, A. V., Thomsen, J. H. D., Nielsen, P. H., Dueholm, M. K. D.2026-02-28💻 bioinformatics

ESMRank reveals a transferable axis of protein mutational constraint from overlapping variant effect assays

本論文は、重複する変異効果アッセイから「変異妥当性（variant soundness）」という枠組みを用いて一貫した制約軸を抽出し、タンパク質言語モデルと物理化学記述子を統合した予測モデル「ESMRank」を開発することで、臨床的監督なしにタンパク質全体の機能変異を解釈可能かつ高精度に予測する手法を確立したことを報告しています。

Arnese, R., Gambardella, G.2026-02-28💻 bioinformatics

Random Matrix Theory-guided sparse PCA for single-cell RNA-seq data

この論文は、単一細胞 RNA シーケンシングデータのノイズをランダム行列理論に基づいて推定し、スパース PCA のスパース性を自動的に選択することで、従来の PCA や深層学習手法よりも優れた次元削減と細胞分類を可能にする新しい手法を提案しています。

Chardes, V.2026-02-28💻 bioinformatics

← 前へ次へ →