バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Discovery of TDP-43 aggregation inhibitors via a hybrid machine learning framework

本研究は、グラフニューラルネットワークと従来の化学記述子を組み合わせたハイブリッド機械学習フレームワークを開発し、TDP-43 凝集阻害剤として berberrubine と PE859 の 2 つの有望な化合物を同定・実験的に検証した。

Kapsiani, S., Vora, S., Fernandez-Villegas, A., Kaminski, C. F., Läubli, N. F., Kaminski Schierle, G. S.2026-02-14💻 bioinformatics

CodonRL: Multi-Objective Codon Sequence Optimization Using Demonstration-Guided Reinforcement Learning

本論文は、実例に基づく強化学習と構造評価を統合した「CodonRL」を提案し、従来の手法や最先端の GEMORNA を上回る翻訳効率、RNA 安定性、組成特性の向上を実現する多目的コドン配列最適化フレームワークを構築したことを報告しています。

Du, S., Kaynar, G., Li, J., You, Z., Tang, S., Kingsford, C.2026-02-14💻 bioinformatics

Machine learning-guided design of artificial microRNAs for targeted gene silencing

本研究は、機械学習を活用して人工マイクロ RNA の設計を支援し、高い効率性と特異性で遺伝子サイレンシングを実現するウェブプラットフォーム「miRarchitect」を開発し、その有効性を TMPRSS2 および ACE-2 遺伝子に対する実験的検証と他ツールとの比較を通じて実証したものである。

Belter, A., Synak, J., Mackowiak, M., Kotowska-Zimmer, A., Figlerowicz, M., Szachniuk, M., Olejniczak, M.2026-02-14💻 bioinformatics

Theseus: Fast and Optimal Affine-Gap Sequence-to-Graph Alignment

本論文は、最適性を保ちながら高速かつ低メモリで任意のグラフ(循環グラフを含む)に対するアファインギャップ配列対グラフアラインメントを可能にする新しいアルゴリズム「Theseus」を提案し、MSA やパンゲノムリードマッピングにおいて既存の手法を大幅に上回る性能を実証したものです。

Jimenez-Blanco, A., Lopez-Villellas, L., Moure, J. C., Moreto, M., Marco-Sola, S.2026-02-14💻 bioinformatics

evoCancerGPT: Generating Zero-Shot Single-Cell and Single-Sample Cancer Progression Through Transfer Learning

本研究は、276 万の細胞トークンを用いた転移学習に基づく生成モデル「evoCancerGPT」を開発し、単一患者の単一細胞レベルで偽時間順序に基づいてがんの進化における将来の遺伝子発現プロファイルをゼロショットで予測し、既存の手法を上回る精度で腫瘍の進行を特徴づけることを示しました。

Wang, X., Tan, R., Cristea, S.2026-02-14💻 bioinformatics

ChatDIA: A zero-shot large language model workflow for targeted analysis of data-independent acquisition mass spectrometry data

本論文は、複雑なデータ非依存取得(DIA)質量分析データを、専門的なモデルに依存せずゼロショットで推論し、透明性のある判断根拠を提供する大規模言語モデルベースのワークフロー「ChatDIA」を提案し、単一細胞プロテオミクスを含む多様なベンチマークにおいて既存の最先端ソフトウェアと同等以上の性能を達成したことを報告しています。

Li, J., Charkow, J., Gao, M., Li, J., Rost, H.2026-02-13💻 bioinformatics