バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

TF-IDF k-mer-based Classical and Hybrid Machine Learning Models for SARS-CoV-2 Variant Classification under Imbalanced Genomic Data

本論文は、極端なクラス不均衡に直面する SARS-CoV-2 バリアント分類において、深層学習よりも TF-IDF ベースの k-mer 特徴量を用いた古典的およびハイブリッド機械学習モデル(特に RF-SVM)が、希少変異の検出精度と一般化能力において優れていることを示しています。

Haque, N., Mazed, A., Ankhi, J. N., Uddin, M. J.2026-04-02💻 bioinformatics

Benchmarking Heritability Estimation Strategies Across 86 Configurations and Their Downstream Effect on Polygenic Risk Score Performance

この研究は、86 種類の推定設定による SNP 遺伝率の推定値が大幅に変動するにもかかわらず、その変動がポリジニックリスクスコア(PRS)の性能にはほとんど影響を与えないことを示し、遺伝率推定値は設定に依存するパラメータとして解釈すべきであり、PRS 性能は遺伝率入力の変動に対して比較的頑健であることを結論付けています。

Muneeb, M., Ascher, D.2026-04-02💻 bioinformatics

SEGUID v2: Extending SEGUID checksums for circular, linear, single- and double-stranded biological sequences

本論文は、環状や二本鎖 DNA などの多様な生物学的配列の整合性を検証できるよう、SEGUID チェックサムを拡張し、向きや回転に依存しない新しいバージョン「SEGUID v2」を提案し、マルチプラットフォーム対応のツールとして公開したことを報告しています。

Pereira, H., Silva, P. C., Davis, W. M., Abraham, L., Babnigg, G., Bengtsson, H., Johansson, B.2026-04-01💻 bioinformatics

Inferring a novel insecticide resistance metric and exposurevariability in mosquito bioassays across Africa

この論文は、マラリア対策における蚊の殺虫剤耐性を評価する際、従来の判別濃度生物試験に加え、より感度の高い強度濃度生物試験のデータを取り入れた新たな数学モデルを開発し、野外の実験小屋試験での蚊の死亡率を高精度に予測することで、耐性モニタリング結果を公衆衛生への影響評価に統合する手法を提案しています。

Denz, A., Kont, M. D., Sanou, A., Churcher, T. S., Lambert, B.2026-04-01💻 bioinformatics

Finding stable clusterings of single-cell RNA-seq data

この論文は、UMI カウント行列に対して分割階層的スペクトルクラスタリングを適用し、正規化カットに基づく木構造の定義とサブサンプリングによる一貫性評価を通じて、単一細胞 RNA シーケンシングデータの安定したクラスタリングを特定する手法を提案し、実データでその有効性を検証したものである。

Klebanoff, V. F.2026-04-01💻 bioinformatics

High-throughput prediction of protein-protein interactions uncovers hidden molecular networks in biosynthetic gene clusters

本研究は、AlphaFold3 の高速化版パイプラインを開発し、MIBiG データベースに登録された数千の生物合成遺伝子クラスターから数千のタンパク質対を網羅的に解析することで、未解明の分子ネットワークや酵素複合体を同定し、天然物生合成経路の理解を深めるための包括的な予測結果を提供しました。

Moriwaki, Y., Shiraishi, T., Katsuyama, Y., Matsuda, K., Ose, T., Minami, A., Oikawa, H., Kuzuyama, T., Ishitani, R., Terada, T.2026-04-01💻 bioinformatics