バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Probabilistic coupling of cellular and microenvironmental heterogeneity by masked self-supervised learning

本論文は、マスク自己教師あり学習とトランスフォーマーアーキテクチャを活用した「Mievformer」というフレームワークを提案し、細胞状態と空間的マイクロ環境の確率的な結合を捉えることで、空間オミクスデータにおけるマイクロ環境の表現学習と生物学的発見を可能にすることを示しています。

Kojima, Y., Tanaka, Y., Hirose, H., Chiwaki, F., Nishimura, K., Hayashi, S., Itahashi, K., Ishikawa, M., Shimamura, T., Mano, H.2026-04-24💻 bioinformatics

Genomic dialects: How amino acid properties and the second codon base shape the informational accents of life

本研究は、1,406 種のアミノ酸使用偏倚(CUB)を「ゲノム方言」として分析し、アミノ酸の物理化学的性質(特に Saier の第二コドン塩基分類)が翻訳の忠実度やタンパク質の安定性という制約下で CUB を決定し、これが系統関係ではなく機能的な「情報アクセント」を形成していることを示しました。

Martinez, O., Ochoa-Alejo, N.2026-04-24💻 bioinformatics

Efficient and scalable modelling of cotranscriptional RNA folding with deterministic and iterative RNA structure sampling

本研究では、確率的サンプリングや既存のサブオプティマル法の問題点を克服し、RNA 二次構造を自由エネルギーの昇順で排他的かつ効率的に列挙する決定論的フレームワーク「反復サンプリング」を開発し、これにより転写中の RNA フォルディングにおける非平衡構造の解析や実験データとの整合性向上を実現したことを報告しています。

Courtney, E., Choi, E., Ward, M., Lucks, J. B.2026-04-24💻 bioinformatics

Graph Neural Networks (GNNs) for Protein-Ligand Interaction Prediction

本論文は、グラフニューラルネットワーク(GNN)の解釈可能性を向上させるための視覚化やアテンション機構などの手法、タンパク質言語モデルとの統合、およびハイブリッドアーキテクチャの活用を通じて、創薬におけるタンパク質 - リガンド相互作用の予測精度と生物学的信頼性を高めることを目指す研究を概説しています。

Khilar, S., Natarajan, E.2026-04-24💻 bioinformatics

Reveal Principles of Codon Optimization via Machine Learning

本研究では、経験則に基づく古典的手法とエンドogenous 遺伝子から学習する AI 手法の 2 つのアプローチに基づいて開発されたコードン最適化ツール「OptimWiz 2.1」と「OptimWiz 3.0」が、市販の他のツールを上回るタンパク質発現効率を示し、機械学習を通じてコードン最適化の原理を解明したことを報告しています。

Deng, F., Li, H., Sun, D., Duan, G., Sun, Z., Xue, G.2026-04-23💻 bioinformatics

EpiRanha: Hunting for Epitope Similarity with a Structure- and Residue-Aware Graph Neural Network

本研究は、配列と立体構造の両方を統合的に学習するマルチモーダルフレームワーク「EpiRanha」を開発し、従来の手法では困難だった不連続なエピトープの高精度な類似性検索とオフターゲットリスク評価を実現したことを報告しています。

Francissen, T., Babukhian, M., Britze, H., Wilke, Y., Spreafico, R., Demharter, S., Arts, M.2026-04-23💻 bioinformatics