バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

A structure-informed deep learning framework for modeling TCR-peptide-HLA interactions

本研究は、物理化学的・配列文脈・構造的特徴を統合した深層学習フレームワーク「StriMap」を開発し、TCR-ペプチド-HLA 相互作用の高精度予測を実現するとともに、強直性脊椎炎における分子擬態の同定や自己免疫疾患の抗原駆動因子の解明に成功したことを報告しています。

Cao, K., Li, R., Strazar, M., Brown, E. M., Nguyen, P. N. U., Pust, M.-M., Park, J., Graham, D. B., Ashenberg, O., Uhler, C., Xavier, R.2026-04-02💻 bioinformatics

CardamomOT: a mechanistic optimal transport-based framework for gene regulatory network inference, trajectory reconstruction and generative modeling

CardamomOT は、機械的モデルと最適輸送の枠組みを統合し、単細胞 RNA シーケンシング時系列データから遺伝子制御ネットワークの推論、細胞軌道の再構築、および未観測タンパク質動態の予測を高精度かつロバストに行う新しい手法を提案するものである。

Mauge, Y., Ventre, E.2026-04-02💻 bioinformatics

When Multimodal Fusion Fails: Contrastive Alignment as a Necessary Stabilizer for TCR--Peptide Binding Prediction

本論文は、TCR-ペプチド結合予測において構造情報がノイズを含む場合でも、CLIP 風の対照的アライメントを導入してモダリティ間の整合性を制約する軽量フレームワーク「TRACE」を提案し、単純な融合では性能が劣化する問題に対して安定した予測精度の向上を実現することを示しています。

Qi, C., Wang, W., Fang, H., Wei, Z.2026-04-02💻 bioinformatics

Genetic demultiplexing and transcript start site identification from nanopore sequencing of 10x Genomics multiome libraries

この論文は、10x Genomics のマルチオミックスライブラリをナノポアシーケンシングすることで、短読長シーケンシングでは得られなかった転写開始部位(TSS)の情報をフル長転写子として取得でき、遺伝的デマルチプレクシングも成功し、短読長 5'アッセイと比較して検出された TSS の中央値 63% を捉えることを実証したことを示しています。

Mears, J., Orchard, P., Varshney, A., Bose, M. L., Robertson, C. C., Piper, M., Pashos, E., Dolgachev, V., Manickam, N., Jean, P., Kitzman, D. W., Fauman, E., Damilano, F., Roth Flach, R. J., Nicklas (…)2026-04-02💻 bioinformatics

The U-method: Leveraging expression probability for robust biological marker detection

この論文は、単一細胞転写解析において既存の平均発現量に基づく手法の限界を克服し、発現確率の比較に基づく「U-method」を導入することで、異なるデータセット間での検出の一貫性を高め、平滑化や逆分解なしに組織構造を解釈可能な生物学的マーカーを迅速に同定する手法を提案しています。

Stein, Y., Lavon, H., Hindi Malowany, M., Arpinati, L., Scherz-Shouval, R.2026-04-02💻 bioinformatics

Generating and navigating single cell dynamics via a geodesic bridge between nonlinear transcriptional and linear latent manifolds

本論文は、非線形な転写多様体と線形な潜在多様体の間の測地線橋(GeoBridge)を学習することで、単細胞 RNA シーケンシングのスパースなスナップショットから連続的な細胞状態遷移を再構成し、制御可能なナビゲーションや中間状態の生成、および駆動遺伝子の同定を可能にする新しいフレームワークを提案しています。

Zhu, J., Zhang, Z., Sun, Y., Dai, H., Wen, H., Zhou, P., Chen, L.2026-04-02💻 bioinformatics

Decoding antibiotic modes of action from multimodal cellular responses

本論文は、大腸菌における多様な細胞応答データ(プロテオーム、化学構造、成長動態など)を統合し、抗菌薬の作用機序を高精度に予測するとともに新規メカニズムを持つ化合物を検出する新しいフレームワーク「MAPPER」を開発したことを報告しています。

Hesse, J., Schum, D., Leidel, L., Gareis, L. R., Herrmann, J., Müller, R., Sieber, S. A.2026-04-02💻 bioinformatics

HalluCodon enables species-specific codon optimization using multimodal language models

本論文は、マルチモーダル言語モデルを活用して 15 種の植物に特化したコード配列を設計し、宿主固有のコードオン使用パターンを再現して高発現を実現するカスタマイズ可能なフレームワーク「HalluCodon」を開発したことを報告しています。

Lou, Y., Mao, S., Wu, T., Xia, F., Zhang, Z., Tian, Y., Li, Y., Cheng, Q., Yan, J., Wang, X.2026-04-02💻 bioinformatics

EMITS: expectation-maximization abundance estimation for fungal ITS communities from long-read sequencing

この論文は、長リード配列を用いた真菌 ITS コミュニティの種レベルの存在量推定を、単純な最良ヒット分類の限界を克服し、期待値最大化法(EM)を採用した高性能な Rust ツール「EMITS」によって可能にする手法を提案し、シミュレーションおよびモックコミュニティを用いた検証でその精度向上を実証したものである。

O'Brien, A., Lagos, C., Fernandez, K., Ojeda, B., Parada, P.2026-04-02💻 bioinformatics