バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

User-driven development and evaluation of an agentic framework for analysis of large pathway diagrams

本論文は、分子相互作用マップの探索を支援する LLM ベースのシステム「Llemy」を、ドメイン専門家との協働によるユーザー駆動型開発プロセスを通じて設計・評価し、その有用性を検証した研究を報告するものである。

Corradi, M., Djidrovski, I., Ladeira, L., Staumont, B., Verhoeven, A., Sanz Serrano, J., Rougny, A., Vaez, A., Hemedan, A., Mazein, A., Niarakis, A., de Carvalho e Silva, A., Auffray, C., Wilighagen (…)2026-03-12💻 bioinformatics

Accounting for Defective Viral Genomes in viral consensus genome reconstruction, application to influenza virus

国立パステル研究所の呼吸器ウイルス国立参照センターが開発した「DIPScan」は、欠損を含むウイルスゲノム(DelVGs)を自動検出し、それらがコンセンサス配列の精度に与える影響を補正することで、インフルエンザウイルスなどの監視における正確なゲノム再構築を実現する手法です。

Da Silva, K., Naffakh, N., Rameix-Welti, M.-A., Lemoine, F.2026-03-12💻 bioinformatics

MultiPopPred: A Trans-Ethnic Disease Risk Prediction Method, and its Application to the South Asian Population

本研究は、複数の補助集団から得た情報を転移学習により活用する簡易な手法「MultiPopPred」を提案し、特に個人レベルのデータを持つ南アジア集団など低資源集団におけるポリジニックリスクスコアの予測精度を大幅に向上させることを示しています。

Kamal, R., Narayanan, M.2026-03-11💻 bioinformatics

Hybrid untargeted and targeted RNA sequencing facilitates genotype-phenotype associations at single-cell resolution

本論文は、広範な転写産物カバレッジを提供する短リード全転写増幅(SR-WTA)と、深い変異検出を可能にする長リード標的シーケンシング(LR-Twist)を統合したハイブリッド戦略と解析パイプラインを提案し、これにより単一細胞レベルでの遺伝子型と表現型の関連付けを可能にすることを示しています。

Wang, J., Maldifassi, M., Bratus-Neuenschwander, A., Zhang, Q., Beuschlein, F., Penton, D., Robinson, M. D.2026-03-11💻 bioinformatics

Generalise or Memorise? Benchmarking Ligand-Conditioned Protein Generation from Sequence-Only Data

本研究は、小分子リガンドの配列情報のみを用いてタンパク質結合体を生成する言語モデルを大規模データで訓練し、リガンドとタンパク質のペア数のバランスが生成される配列の多様性と折りたたみ可能性の間にトレードオフを生むことを明らかにし、データセットの冗長性と不完全性が配列のみの設計におけるボトルネックであることを示しました。

Vicente, A., Dornfeld, L., Coines, J., Ferruz, N.2026-03-11💻 bioinformatics

Automated extraction and optimization of protein purification protocols using multi-agent large language models

この論文は、文献からのプロトコル抽出と最適化を自動化するマルチエージェント LLM システムを提案し、タンパク質精製プロセスの効率化と成功率向上を実証するとともに、学術文献へのプログラムによるアクセス制限が現在の課題であることを指摘しています。

Ye, J., DeRocher, A., Khim, M., Subramanian, S., Cron, L., Myler, P. J., Phan, I. Q.2026-03-11💻 bioinformatics