バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

DeepTrio: Variant Calling in Families Using Deep Learning

この論文は、親と子のトリオデータから直接学習し、シーケンシング誤差や突然変異率を自動的に重み付けすることで、従来の DeepVariant よりも特に低カバレッジ条件下で高精度なバリアント検出を実現する深層学習ベースのツール「DeepTrio」を提案しています。

Brambrink, L., Kolesnikov, A., Goel, S., Nattestad, M., Yun, T., Baid, G., Yang, H., McLean, C., Shafin, K., Chang, P.-C., Carroll, A.2026-04-02💻 bioinformatics

Towards a Cytometry Foundation Model: Interpretable Sample-level Predictive Modelling via Pretrained Transformers

本研究は、異なるマーカーパネルから学習可能な可解釈な事前学習型トランスフォーマー「GPCT」を提案し、フローサイトメトリー分野におけるスケーラブルかつ一般化されたサンプルレベルの予測モデルと生物学的検証の基盤を確立したことを示しています。

Zhuang, Z., Mashford, B. S., Zheng, L., Andrews, T. D.2026-04-02💻 bioinformatics

DESPOT: Direction-Enhanced Scoring POTentials

既存の等方的な知識ベースポテンシャルの限界を克服し、原子の方向性を考慮した非等方的な確率モデル「DESPOT」を提案することで、タンパク質 - リガンド相互作用のスコアリングや結合部位の特性評価において、姿勢識別や仮想スクリーニングの精度を大幅に向上させた。

Poelmans, R., Bruncsics, B., Arany, A., Van Eynde, W., Shemy, A., Moreau, Y., Voet, A. R.2026-04-02💻 bioinformatics

When Multimodal Fusion Fails: Contrastive Alignment as a Necessary Stabilizer for TCR--Peptide Binding Prediction

本論文は、TCR-ペプチド結合予測において構造情報がノイズを含む場合でも、CLIP 風の対照的アライメントを導入してモダリティ間の整合性を制約する軽量フレームワーク「TRACE」を提案し、単純な融合では性能が劣化する問題に対して安定した予測精度の向上を実現することを示しています。

Qi, C., Wang, W., Fang, H., Wei, Z.2026-04-02💻 bioinformatics

Decoding antibiotic modes of action from multimodal cellular responses

本論文は、大腸菌における多様な細胞応答データ(プロテオーム、化学構造、成長動態など)を統合し、抗菌薬の作用機序を高精度に予測するとともに新規メカニズムを持つ化合物を検出する新しいフレームワーク「MAPPER」を開発したことを報告しています。

Hesse, J., Schum, D., Leidel, L., Gareis, L. R., Herrmann, J., Müller, R., Sieber, S. A.2026-04-02💻 bioinformatics

EMITS: expectation-maximization abundance estimation for fungal ITS communities from long-read sequencing

この論文は、長リード配列を用いた真菌 ITS コミュニティの種レベルの存在量推定を、単純な最良ヒット分類の限界を克服し、期待値最大化法(EM)を採用した高性能な Rust ツール「EMITS」によって可能にする手法を提案し、シミュレーションおよびモックコミュニティを用いた検証でその精度向上を実証したものである。

O'Brien, A., Lagos, C., Fernandez, K., Ojeda, B., Parada, P.2026-04-02💻 bioinformatics

TF-IDF k-mer-based Classical and Hybrid Machine Learning Models for SARS-CoV-2 Variant Classification under Imbalanced Genomic Data

本論文は、極端なクラス不均衡に直面する SARS-CoV-2 バリアント分類において、深層学習よりも TF-IDF ベースの k-mer 特徴量を用いた古典的およびハイブリッド機械学習モデル(特に RF-SVM)が、希少変異の検出精度と一般化能力において優れていることを示しています。

Haque, N., Mazed, A., Ankhi, J. N., Uddin, M. J.2026-04-02💻 bioinformatics

Benchmarking Heritability Estimation Strategies Across 86 Configurations and Their Downstream Effect on Polygenic Risk Score Performance

この研究は、86 種類の推定設定による SNP 遺伝率の推定値が大幅に変動するにもかかわらず、その変動がポリジニックリスクスコア(PRS)の性能にはほとんど影響を与えないことを示し、遺伝率推定値は設定に依存するパラメータとして解釈すべきであり、PRS 性能は遺伝率入力の変動に対して比較的頑健であることを結論付けています。

Muneeb, M., Ascher, D.2026-04-02💻 bioinformatics

Inferring a novel insecticide resistance metric and exposurevariability in mosquito bioassays across Africa

この論文は、マラリア対策における蚊の殺虫剤耐性を評価する際、従来の判別濃度生物試験に加え、より感度の高い強度濃度生物試験のデータを取り入れた新たな数学モデルを開発し、野外の実験小屋試験での蚊の死亡率を高精度に予測することで、耐性モニタリング結果を公衆衛生への影響評価に統合する手法を提案しています。

Denz, A., Kont, M. D., Sanou, A., Churcher, T. S., Lambert, B.2026-04-01💻 bioinformatics