バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

FairTCR: Equity-Aware TCR--pMHC Binding Prediction\\Across HLA Alleles and Cohort Strata

本論文は、HLA アレルやコホート層におけるデータ偏りによる予測格差を解消するため、グループ分布ロバスト最適化(GDRO)フレームワーク「FairTCR」を提案し、最悪グループの性能を維持しつつ平均性能を低下させずに公平性を大幅に向上させたことを示しています。

Nowak, P., Kowalski, J., Lewandowski, T.2026-04-17💻 bioinformatics

Using machine learning to overcome mosquito collections missing data for malaria modeling

この論文は、ベネズエラ・ボリバル州の不完全な蚊の観測データに機械学習を適用して欠損値を補完し、その結果を気候変数と組み合わせてマラリア発生を予測するモデルを構築したところ、P. vivax の予測精度向上に成功したが P. falciparum の予測には至らなかったことを報告しています。

Rubio-Palis, Y., Feng, L., Liang, K. S., Song, C., Wang, S., Duchnicki, T., Zhang, X., Bravo de Guenni, L.2026-04-17💻 bioinformatics

ORION: An agentic reasoning construct for the analysis of complex human immune profiling

本研究は、統計解析、機械学習、自動文献レビューを統合した多エージェント AI フレームワーク「ORION」を開発し、複雑な免疫プロファイリングデータの解釈を数ヶ月から数時間へ短縮し、新たな生物学的仮説の生成を可能にしたことを報告しています。

Dayao, M. T., Kim, K., Khor, B., Jaech, A., van Opheusden, B., Bodansky, A., DeRisi, J.2026-04-16💻 bioinformatics

Generative design of intrinsically disordered proteins based on conditioned protein language models: Data is the limit

本論文は、タンパク質言語モデルを用いた条件付き生成フレームワークにより、特定のコンフォメーション集合記述子に基づいた内在性無秩序タンパク質(IDR)の設計が可能であることを示したが、その精度向上には大規模なデータセットが不可欠であり、データ量が IDR 設計における主要な限界要因であることを明らかにした。

Carriere, L., Huyghe, A., Pajkos, M., Bernado, P., Cortes, J.2026-04-16💻 bioinformatics

Sampling antibody conformational ensembles withABodyBuilder4-STEROIDS

抗体のコンフォメーション・アンサンブルを高精度にサンプリングし、実験的証拠と照合して状態最良の性能を示す生成モデル「ABB4-STEROIDS」が新たに開発され、大規模な抗体コンフォメーション研究のためのオープンなリソースとして提供されました。

Spoendlin, F. C., Cagiada, M., Ifashe, K., Vavourakis, O., Deane, C. M.2026-04-16💻 bioinformatics

ProteomeScan: A Toolkit For Target Validation By Proteome-Wide Docking And Analysis

ProteomeScan は、クラウド規模の高性能計算を活用してヒトプロテオム全体にわたる分子ドッキングシミュレーションを行い、既存の計算手法の限界を克服し、潜在的なタンパク質 - リガンド相互作用を特定・検証するための大規模な計算ツールキットとして開発され、その有効性が確認された。

Barsainyan, A. A., Panda, R., Siguenza, J., Merico, D., Ramsundar, B.2026-04-16💻 bioinformatics