バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

OT-knn: a neighborhood-aware optimal transport framework for aligning spatial transcriptomics data

この論文は、空間的ノイズや生物学的なばらつきに頑健な空間トランスクリプトミクスデータの整列を実現するため、最適輸送枠組みに局所近傍情報を統合した新しい手法「OT-knn」を提案し、ヒト・マウス・イモリなど多様な生物種および実験条件におけるその有効性を実証したものである。

Song, J., Li, Q.2026-02-20💻 bioinformatics

Chemical Probes in Scientific Literature: Expanding and Validating Target-Disease Evidence

本論文は、1800 万超の文献を網羅的に分析し、化学プローブが標的 - 疾患間の関連性を既存データベースより 1〜7 年先行して示唆し、新規治療標的の発見や既存エビデンスの強化に不可欠な役割を果たしていることを実証した世界初の研究である。

Adasme, M. F., Ochoa, D., Lopez, I., Do, H.-M.-A., McDonagh, E. M., O'Boyle, N. M., Leach, A. R., Zdrazil, B.2026-02-20💻 bioinformatics

How to gain valuable insight from scarce data with Machine Learning: a post-hoc explanation tool to identify biases in biological images classification

本研究は、限られた生物画像データを用いた機械学習において、モデルの説明手法(SHAP)を適用することで、個体識別という見かけ上の成功の背後にあるバイアスを特定し、データが実際に支持する生物学的な意味(治癒の段階など)を抽出する有効性を示しました。

Bolut, C., Pacary, A., Pieruccioni, L., Ousset, M., Paupert, J., Casteilla, L., Simoncini, D.2026-02-20💻 bioinformatics

ProteinConformers: large-scale and energetically profiled descriptions of protein conformational landscapes

ProteinConformers は、マルチシード分子動力学法によって生成された 270 万の幾何学最適化コンフォメーションとエネルギー評価、類似性注釈を提供し、タンパク質のコンフォメーションランドスケープの包括的な記述、ベンチマーク枠組み、および対話型分析プラットフォームを実現する大規模リソースです。

Zhou, Y., Wei, C., Sun, M., Wang, L., Song, J., Xu, F., Li, Y., Zheng, W., Zhang, Y.2026-02-20💻 bioinformatics

Investigating the topological motifs of inversions in pangenome graphs

本論文は、パンゲノムグラフにおける逆位変異の検出課題を特定し、そのトポロジカルなモティーフを同定するツールを開発して、既存パイプラインがシミュレーションおよび実データにおいて逆位変異を適切に検出・表現できていない現状を明らかにしたものである。

Romain, S., Dubois, S., Legeai, F., Lemaitre, C.2026-02-19💻 bioinformatics

Harnessing DNA Foundation Models for Cross-Species Transcription Factor Binding Site Prediction in Plant Genomes

本研究は、Arabidopsis thaliana と Sisymbrium irio の DAP-seq データを用いて DNA ファウンデーションモデル(DNABERT-2、AgroNT、HyenaDNA)を評価し、特に HyenaDNA が従来の手法を上回る精度と計算効率で植物の転写因子結合部位を予測できることを実証しました。

Haghani, M., Dhulipalla, K. V., Li, S.2026-02-19💻 bioinformatics

Impact of Data Quality on Deep Learning Prediction of Spatial Transcriptomics from Histology Images

本研究は、深層学習を用いた組織画像からの空間トランスクリプトミクス予測において、モデルアーキテクチャの改良だけでなく、分子データのスパース性やノイズ、画像解像度といったデータ品質の向上が予測性能の向上に不可欠であることを示しています。

Hallinan, C., Lucas, C.-H. G., Fan, J.2026-02-19💻 bioinformatics