バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Evolutionary exploration of drug-like chemical space utilizing generative AI and virtual screening

本研究は、生成 AI と進化アルゴリズムを統合したフレームワークを開発し、超広大な化学空間から合成可能な新規リード分子を効率的に探索・同定し、μオピオイド受容体に対する pH 依存性リガンドの生物学的検証に成功したことを報告しています。

Secker, C., Secker, P., Yergoez, F., Celik, M. O., Chewle, S., Phuong Nga Le, M., Masoud, M., Christgau, S., Weber, M., Gorgulla, C., Nigam, A., Pollice, R., Schuette, C., Fackeldey, K.2026-03-30💻 bioinformatics

ClumPyCells resolves spatial aggregation in complex tissues overcoming size biases

本研究は、細胞の形態やサイズによるバイアスを補正し、複雑な組織における細胞やマーカーの空間的凝集性を正確に評価するための統計的フレームワーク「ClumPyCells」を提案し、腫瘍組織の新たなパターン解明を可能にするものである。

Zhao, Z., Cui, L., Aguilar-Navarro, A. G., Monajemzadeh, M., Chang, Q., Chen, Z., Tsui, H., Flores-Figueroa, E., Schwartz, G. W.2026-03-30💻 bioinformatics

PHENOCAUZ: Linking Human Symptoms, Drug Side Effects and Efficacy to Their Molecular Causes Using Mendelian Disease Biology

本研究は、メンデル遺伝性疾患の遺伝子 - 表現型関係とタンパク質の分子特徴を統合する計算フレームワーク「PHENOCAUZ」を開発し、臨床症状と分子原因を結びつけることで、複雑疾患の分子メカニズムの解明、薬剤副作用の予測、および新たな治療標的の発見を可能にしたことを示しています。

Zhou, H., Skolnick, J.2026-03-30💻 bioinformatics

Cellector: A tool to detect foreign genotype cells in scRNAseq data with applications in leukemia and microchimerism.

この論文は、移植後の白血病患者における微小残存病変(MRD)やマイクロキメリズムなどの研究において、単一細胞 RNA シーケンスデータから極めて稀な外来遺伝子型細胞(0.05% 以下)を検出するための計算手法「Cellector」を提案し、その高い精度を実証したものである。

Heaton, H., Behboudi, R., Ward, C., Weerakoon, M., Kanaan, S., Reichle, S., Hunter, N., Furlan, S.2026-03-30💻 bioinformatics

scSAGA: Single-cell Sampled Gromov Wasserstein Alignment for Scalable and Memory-efficient Integration of Multi-modal Single Cell Data

scSAGA は、単細胞 RNA シーケンシングとクロマチンアクセシビリティデータの多モーダル統合において、幾何学的構造を保持しつつメモリ効率とスケーラビリティを実現し、100 万細胞規模のデータセットに対しても高精度なマッピングとクラスタリングを可能にする新たな手法です。

Bhattaram, S., Chockalingam, S. P., Aluru, M., Aluru, S.2026-03-30💻 bioinformatics

AINN-P1: A Compact Sequence-Only Protein Language Model Achieves Competitive Fitness Prediction on ProteinGym

本論文は、MSA や構造情報に依存せず、1 億 6700 万パラメータのコンパクトな再帰型アーキテクチャ(mLSTM)のみを用いて学習されたタンパク質言語モデル「AINN-P1」を提案し、ProteinGym における安定性予測などでシーケンスのみのモデルとして最高レベルの性能を達成し、実用的な展開性を示したものである。

Wang, R., Jin, K., Pan, L.2026-03-30💻 bioinformatics

Transposable elements as new players to decipher sex differences in Parkinson Disease

この論文は、パーキンソン病の性差を解明するため、単一細胞 RNA シーケンスデータを用いて転移性要素(TEs)の細胞特異的発現変化を統合的に解析し、TEs が関与する可能性のある作用機序を提案するものです。

Gordillo-Gonzalez, F., Galiana-Rosello, C., Grillo-Risco, R., Soler-Saez, I., Hidalgo, M. R., Siomi, H., Kobayashi-Ishihara, M., Garcia-Garcia, F.2026-03-30💻 bioinformatics

Lemonite: identification of regulatory metabolites through data-driven, interpretable integration of transcriptomics and metabolomics data

Lemonite は、トランスクリプトミクスとメタボロミクスデータを解釈可能な形で統合し、事前知識に依存せずに遺伝子モジュールに作用する新規な調節代謝物を同定するためのデータ駆動型フレームワークである。

Vandemoortele, B., Devlies, H., Michoel, T., Vanhaecke, L., Vandenbroucke, R. E., Laukens, D., Vermeirssen, V.2026-03-30💻 bioinformatics

deluxpore: a Nextflow pipeline for demultiplexing Illumina dual-indexed Nanopore libraries

この論文は、イルミナ・デュアルインデックス化されたナノポアライブラリから残存アダプター断片や高いエラー率を考慮して正確にデマルチプレックスするための、BLAST アライメントとレヴェンシュタイン距離マッチングを採用した Nextflow パイプライン「deluxpore」を開発し、その有効性と最適化されたインデックス設計の重要性を実証したものである。

Arnaiz del Pozo, C., Sanchis-Lopez, C., Huerta-Cepas, J.2026-03-30💻 bioinformatics