バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Evaluation of somatic variant calling methods on high coverage tumour-only amplicon sequencing data in a clinical environment

臨床環境における高カバレッジの腫瘍単独アンプリコンシーケンシングデータに対して、6 種類のソマティック変異検出ツールを Snakemake パイプラインに統合して評価した結果、FreeBayes、VarScan、MuTect2、Pisces の 4 種が HD789 標準試料において最も優れた性能を示したが、FreeBayes は変異数を多く検出する一方でアーティファクトも多発したことが明らかになりました。

Bharne, D., Gaston, D.2026-04-11💻 bioinformatics

Generative design of intrinsically disordered protein regions with IDiom

本論文は、AlphaFold データベースから収集した 3700 万の内在性無秩序領域配列で学習された言語モデル「IDiom」を紹介し、構造的な文脈に条件付けられた配列生成や強化学習による細胞内局在の制御を通じて、従来設計が困難だった内在性無秩序タンパク質領域の創出を可能にしたことを示しています。

Liu, J., Ibarraran, S., Hu, F., Park, A., Dunn, A., Rotskoff, G.2026-04-11💻 bioinformatics

Impact of Regularization Methods and Outlier Removal on Unsupervised Sample Classification

本研究は、高含量アッセイにおける非反復的なバッチ効果や外れ値の除去が分類結果にほとんど影響を与えないことを示し、これらのアッセイの品質指標として反復性のみに依存することの限界と、分類パターンが技術的要因に左右されにくいという実証的知見を提示しています。

Heckman, C. A.2026-04-10💻 bioinformatics

Structure-Based and Stability-Validated Prioritization of BACE1 Inhibitors Integrating Meta-Ensemble QSAR and Molecular Dynamics

本論文は、メタアンサンブル QSAR、構造ベースドッキング、ESM-1b によるハイブリッド相互作用重み付け、および分子動力学シミュレーションを統合した堅牢な計算フレームワークを開発し、アルツハイマー病治療標的である BACE1 に対して BBB 透過性と安定な結合特性を兼ね備えた新規リード化合物を特定したことを報告しています。

Chowdhury, T. D., Shafoyat, M. U., Hemel, N. H., Nizam, D., Sajib, J. H., Toha, T. I., Nyeem, T. A., Farzana, M., Haque, S. R., Hasan, M., Siddiquee, K. N. e. A., Mannoor, K.2026-04-10💻 bioinformatics

TCMCard: A High-Confidence Digital Infrastructure for Traditional Chinese Medicine Quantified by Multi-Dimensional Evidence Integration

本論文は、実験データ、文献、構造類似性を統合する多面的証拠統合フレームワークに基づき、低信頼性のノイズを大幅に排除して伝統中国医学の多成分・多標的メカニズムを解明するための高信頼性デジタル基盤「TCMCard」を提案し、対話型可視化プラットフォームを通じて方剤の相乗作用に関する洞察を提供するものである。

Wang, Y., Dong, W., Yao, J., Wang, K., Zhang, L., Wang, Y., Guo, S., Li, H., Cai, H., Wang, X., Li, Y.2026-04-10💻 bioinformatics

Generating, curating, and evaluating trnL reference sequence databases: Benchmarking OBITools3/ecoPCR, RESCRIPt, and MetaCurator

本論文は、植物の DNA メタバーコーディングに不可欠な trnL 参照配列データベースの生成と評価を目的として、OBITools3/ecoPCR、RESCRIPt、MetaCurator の 3 つのツールを比較し、各 trnL 領域(CD、CH、GH)における分類性能を評価した結果、ツールや領域によって最適な選択が異なることを示し、高品質なデータベースと解析ワークフローを公開したものである。

KUDDAR, O. S., Meiklejohn, K. A., Callahan, B. J.2026-04-10💻 bioinformatics

Deep learning enables direct HLA typing from immunopeptidomics data

本研究では、深層学習を用いて免疫ペプチドミクスデータから直接 HLA タイピングを可能にする新しい予測ツール「Immunotype」を開発し、多様な組織においてタンパク質レベルで 87.2% の精度を達成したことを報告しています。

Pilz, M., Scheid, J., Bauer, A., Lemke, S., Sachsenberg, T., Bauer, J., Nelde, A., Stadelmaier, J., Walter, A., Rammensee, H.-G., Nahnsen, S., Kohlbacher, O., Walz, J. S.2026-04-10💻 bioinformatics

Benchmarking ambient RNA removal across droplet and well-plate platforms reveals artificial count generation as a critical failure mode of scAR and CellClear

本論文は、複数の実験プラットフォームにわたるシステマティックなベンチマークを通じて、scAR や CellClear が人工的なカウントを生成してカウント行列の整合性を損なう重大な欠陥を持つ一方、CellBender や SoupX が信頼性の高い結果を示すことを明らかにし、環境 RNA 除去ツールの選定において除去感度だけでなくカウント行列の整合性を重視すべきであると結論付けています。

Schroeder, L., Gerber, S., Ruffini, N.2026-04-10💻 bioinformatics

Statistical Principles Define an Open-Source Differential Analysis Workflow for Mass Spectrometry Imaging Experiments with Complex Designs

この論文は、複雑な実験デザインを持つ質量分析イメージング研究において、信号処理や関心領域の選択、統計モデルの適切な活用を含むオープンソースの差分分析ワークフローを提案し、ヒトの骨関節炎サンプルとシミュレーションデータを用いてその有効性を検証したものである。

Rogers, E. B. T., Lakkimsetty, S. S., Bemis, K. A., Schurman, C. A., Angel, P. A., Schilling, B., Vitek, O.2026-04-10💻 bioinformatics