バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

CROWN: Curated Repository Of Well-resolved Noncovalent interactions

本論文は、既存のタンパク質 - リガンド複合体データベースの品質と多様性のトレードオフを解決し、自動前処理パイプラインと拘束エネルギー最小化を導入することで、機械学習向けに高品質かつ多様な非共有結合相互作用データセット「CROWN」を構築したことを報告しています。

Poelmans, R., Van Eynde, W., Bruncsics, B., Bruncsics, B., Arany, A., Moreau, Y., Voet, A. R.2026-04-01💻 bioinformatics

geneslator: an R package for comprehensive gene identifier conversion and annotation

本論文は、8 種のモデル生物における遺伝子識別子の統一変換、相同遺伝子マッピング、および経路注釈を可能にする包括的な R パッケージ「geneslator」を開発し、既存ツールが抱える不整合や断片化の問題を解決し、データ解釈性と再現性を向上させることを報告しています。

Cavallaro, G., Micale, G., Privitera, G. F., Pulvirenti, A., Forte, S., Alaimo, S.2026-04-01💻 bioinformatics

Structure-Guided Computational Analysis of Linker effects in an scFv Targeting Guanylyl Cyclase C

本論文は、分子動力学シミュレーションなどの計算手法を用いて、結腸癌の標的であるグアニル酸シクラーゼ C を認識する scFv におけるリンカー設計が、その構造安定性や抗原結合能に与える影響を解析し、合理的な抗体断片最適化の枠組みを確立したものである。

Melo, R., Viegas, T.2026-04-01💻 bioinformatics

T-Rex: Standardized Analysis of Germline Variants in Whole-Exome Sequencing Trios

T-Rex は、プログラミング知識を必要とせず、臨床現場で全エクソームシーケンシング(WES)トリオデータの標準化された解析を可能にするデスクトップアプリケーションであり、高い精度と感度で稀な生殖系列変異の同定を支援します。

Reh, S.-L., Walter, C., Lohse, J., Ghete, T., Metzler, M., Quante, A., Hauer, J., Auer, F.2026-04-01💻 bioinformatics

Claw4Science: A Dataset and Platform for the OpenClaw Scientific Agent Ecosystem

本論文は、分散化と品質のばらつきという課題を抱えるオープンソースの科学 AI エージェント生態系「OpenClaw」を体系化し、91 のプロジェクトと 2,230 のスキルを含む初のキュレーションデータセットを構築するとともに、これを基盤とした統合プラットフォーム「Claw4Science」を公開し、科学 AI エージェントの標準化と将来のベンチマーク開発の基盤を提供することを提案しています。

Xu, M., Chen, J., Zhang, Z.2026-04-01💻 bioinformatics

STAPLE: automating spatial transcriptomics analysis and AI interpretation

STAPLE は、空間トランスクリプトミクス解析における複数のツールの断絶を解消し、単一コマンドによる自動化と AI 駆動の生物学的洞察レポート生成を実現するモジュール型フレームワークである。

Lvovs, D., Quinn, J., Forjaz, A., Santana-Cruz, I., Stapleton, O., Vavikolanu, K., Wetzel, M., Data Science Hub TeamLab,, Demystifying Pancreatic Cancer Therapies TeamLab,, Pagan, V. B., Herb, B. R. (…)2026-04-01💻 bioinformatics

Dynamic multimodal survival prediction in multiple myeloma integrating gene expression, longitudinal laboratories, and treatment history

本研究は、遺伝子発現、経時的な検査値、治療履歴を統合する動的なマルチモーダル深層学習フレームワークを開発し、多発性骨髄腫患者の予後を診断時だけでなく治療経過中も高精度に予測可能にしたことを報告しています。

JIA, S., Lysenko, A., Boroevich, K. A., Sharma, A., Tsunoda, T.2026-04-01💻 bioinformatics

Robust Random Forests for Genomic Prediction: Challenges and Remedies

この論文は、ゲノム予測におけるデータ汚染の問題に対処するため、ランダムフォレストの頑健性を高めるための前処理やアルゴリズム改良などの戦略を評価し、特にデータ変換や順位に基づく手法が汚染データ下での予測精度向上に有効であることを示しています。

Lourenco, V. M., Ogutu, J. O., Piepho, H.-P.2026-04-01💻 bioinformatics