バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie は、既存のデータベースよりも著しく高い感度で好気的および嫌気的 BTEX 分解に関与する基質特異的遺伝子を検出するためにカスタムプロファイル隠れマルコフモデルを活用し、環境および比較ゲノム研究のための統合された代謝経路およびゲノム可視化も提供する、キュレーションされたユーザーフレンドリーなツールである。

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

本研究は、TDP-43 がクロマチンループのアンカーにおいて DNA G-四重鎖構造に結合し安定化させることで、遺伝子転写を調節し長距離クロマチンループ形成を促進することを明らかにし、これにより TDP-43 機能不全に関連する疾患における遺伝子発現異常の機序的説明を提供するものである。

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

本論文は、複数の遺伝的源と未観測の親を考慮してポリクローナル感染から指向性伝播ネットワークを再構築し、主要な公衆衛生指標を推定するモジュール型ベイズフレームワークを導入するものであり、その具体例として*Plasmodium falciparum*用のPlasmotrackソフトウェアが挙げられる。

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

本論文は、R2DT を活用してバイオインフォマティクスおよび機械学習ワークフローへの統合を可能にする包括的な2D 構造可視化を生成しつつ、Rfam の RESTful API を通じて Rfam データをプログラムで取得し、ウイルス非コード RNA の注釈付けを自動化するための計算プロトコルと実用的な例を提示する。

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

本論文は、マイクロアレイやRNA-seqなどの多様な技術を含む多様なデータセットを統合された表現へとシームレスに変換することで公共の遺伝子発現データにおけるクロスプラットフォームの非互換性を克服し、大規模な統合生物学的解析の精度と統計的検出力を大幅に向上させる確率的機械学習フレームワークであるPXNを導入するものである。

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

著者らは、予測構造からシステインの機能的状態(ジスルフィド結合、金属配位、遊離チオール)を正確に予測するタンパク質言語モデルベースのツール「TriCyP」を開発し、これにより ECOD ドメインにまたがる 270 万個のシステインのゲノム規模のカタログを構築して、明確な生物学的パターンを明らかにし、新規の金属結合ファミリーおよび潜在的なタンパク質間相互作用を同定することを可能にしました。

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

本論文は、遠心分離条件をノイズではなく重要な特徴として明示的に考慮することで既存モデルの性能の頭打ちを克服し、新たに公開された厳密な条件が注釈付けられた大腸菌データセットにおいて大幅な精度向上を実現するタンパク質溶解度予測ツール「Aiki-Sol」を導入する。

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

本論文は、発現変動遺伝子に限定されたタンパク質間相互作用ネットワークを活用してストレス応答遺伝子セットを検証する文脈固有の枠組みを提示し、生物学的に裏付けられた「主要応答」遺伝子が温度条件を跨いで有意に相互連結したサブネットワークを形成することを示している。

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics