バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。

Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。

以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。

Multistage Machine Learning Reveals Circadian Gene Programs and Supports a Retina-Choroid Axis in Myopia Development

この研究は、多段階機械学習を用いて解析した結果、視覚発達の遺伝子発現パターンが概日リズム(特に ZT8-ZT12)によって強く規定され、網膜と脈絡膜の協調的なシグナリングが近視の発症・進行に関与していることを明らかにし、その分子メカニズムがヒトでも保存されている可能性を示唆しています。

Watcharapalakorn, A., Poyomtip, T., Tawonkasiwattanakun, P., Dewi, P. K. K., Thomrongsuwannakij, T., Mahawan, T.2026-04-06💻 bioinformatics

sctrial: Participant-Level Differential Analysis for Longitudinal Single-Cell Experiments

臨床試験やトランスレーショナルコホートにおける縦断的シングルセル実験の階層構造に伴う偽反復の問題を解決し、参加者レベルでの推論に基づく厳密な統計解析フレームワーク「sctrial」を開発し、その有効性をシミュレーションと多様な臨床データセットで実証した。

Vasanthakumari, P., Valencia, I., Aghmiouni, M. R., Magana, B., Omar, M. N.2026-04-06💻 bioinformatics

Halo: a pretrained model for whole-cell segmentation from nuclei images in spatial transcriptomics

本論文は、核画像と RNA 転写物の空間分布を統合して学習済みモデル「Halo」を開発し、追加の学習なしに多様な組織で核拡大法を上回る精度で全細胞セグメンテーションを実現し、空間トランスクリプトミクスにおける細胞同定や形態推定の信頼性を向上させることを提案しています。

Zhang, X., Zhuang, H., Ji, Z.2026-04-06💻 bioinformatics

From nucleotides to semantics: genomic representation learning via joint-embedding predictive architecture

本論文は、DNA 配列の局所な塩基再構成に依存する既存の手法の限界を克服し、潜在空間での意味的整合性を最適化する「GenoJEPA」という共同埋め込み予測アーキテクチャに基づくフレームワークを提案し、55 の下流タスクにおいて高い汎化性能と計算効率の両立を実現したことを報告しています。

Wang, C., Qi, Q., Sun, H., Zhuang, Z., He, B., Liu, S., Liao, J., Wang, J.2026-04-06💻 bioinformatics

Looplook: An integrative suite for target assignment and functional annotation of chromatin interactions empowered by expression-aware refinement and connected components clustering

本論文は、物理的な 3D 染色質相互作用と転写活性を統合的に解析し、偽陽性を排除して高信頼性の空間的遺伝子制御ネットワークを構築するオープンソース R パッケージ「Looplook」を開発し、機能ゲノミクスにおける標的遺伝子の割り当てと機能注釈を革新することを報告しています。

Zhang, Y., Huang, X., Chen, Y., Xu, L.2026-04-06💻 bioinformatics

Sequence-Driven Drug-Target Affinity Prediction Via Graph Attention Networks and Bidirectional Cross-Attention Fusion

構造データが不要なシーケンス駆動型の Drug-Target 親和性予測モデル「XAttn-DTA」は、分子グラフと ESM2 予測コンタクトマップに基づくタンパク質グラフを双方向クロスアテンションで融合し、既存手法を大幅に上回る精度と未知の化合物・タンパク質ファミリーに対する汎化性能を実現しました。

Kudari, Z., Kaira, V. S., P, S. S., Bhat, R., Gnana Sekaran, J.2026-04-06💻 bioinformatics

Unravelling genome-wide mosaic microsatellite mutations at single-cell resolution

この論文では、単一細胞解像度でモザイク短鎖反復配列(STR)変異を検出する新しいアルゴリズム「BayesMonSTR」を開発し、加齢に伴う脳神経細胞における STR 変異の蓄積やその機能的位置的特徴を明らかにすることで、疾患関連変異の発見と発育・加齢における STR 変異の未解明な側面を解明したことを報告しています。

Wang, C., Fan, W., Wang, W., Xia, Y., Lu, J., Ma, X., Yu, J., Zheng, Y., Luo, Y., Li, W., Yang, Q., Lin, M., Liu, H., Lan, Y., Li, C., Liu, X., HE, D., Cai, S., Yu, X., Zhou, D., Kellis, M., Xiong, X. (…)2026-04-05💻 bioinformatics

Widespread data leakage inflates accuracy and corrupts biomarker discovery in cancer drug response prediction

がん細胞の薬剤応答予測において、交差検証前に全サンプルで特徴量選別を行う広範なデータリーク慣行が精度を過大評価し、生物学的シグナルではなく統計的アーティファクトを捉えることでバイオマーカー発見を歪めていることを、大規模データと文献監査を通じて実証し、その修正手法とガイドラインを提示しています。

Asiaee, A., Strauch, J., Azinfar, L., Pal, S., Pua, H. H., Long, J. P., Coombes, K. R.2026-04-05💻 bioinformatics

Comprehensive characterization of V(D)J recombination from long-read transcriptomic data with VDJcraft

長読長転写データを用いた V(D)J 再結合の包括的な解析を可能にする新規パイプライン「VDJcraft」を開発し、その精度向上、新規遺伝子サブクラスの発見、および COVID-19 患者における免疫応答動態の解明を実証しました。

Hu, K., Rosenberg, A. F., Song, Y., Fan, C.-H., Peng, Z., Gao, M., Chong, Z.2026-04-05💻 bioinformatics