NovoTax: prokaryotic strain identification from mass spectrometry-based proteomics data
本論文は、既知の配列情報に依存せず、質量分析に基づくプロテオミクスデータから直接原核生物の菌株を同定するためのエンドツーエンドパイプライン「NovoTax」を開発し、その精度と汚染種や微生物群集の主要種を特定する能力を実証したものである。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、既知の配列情報に依存せず、質量分析に基づくプロテオミクスデータから直接原核生物の菌株を同定するためのエンドツーエンドパイプライン「NovoTax」を開発し、その精度と汚染種や微生物群集の主要種を特定する能力を実証したものである。
この研究は、多段階機械学習を用いて解析した結果、視覚発達の遺伝子発現パターンが概日リズム(特に ZT8-ZT12)によって強く規定され、網膜と脈絡膜の協調的なシグナリングが近視の発症・進行に関与していることを明らかにし、その分子メカニズムがヒトでも保存されている可能性を示唆しています。
臨床試験やトランスレーショナルコホートにおける縦断的シングルセル実験の階層構造に伴う偽反復の問題を解決し、参加者レベルでの推論に基づく厳密な統計解析フレームワーク「sctrial」を開発し、その有効性をシミュレーションと多様な臨床データセットで実証した。
本論文は、核画像と RNA 転写物の空間分布を統合して学習済みモデル「Halo」を開発し、追加の学習なしに多様な組織で核拡大法を上回る精度で全細胞セグメンテーションを実現し、空間トランスクリプトミクスにおける細胞同定や形態推定の信頼性を向上させることを提案しています。
本論文は、DNA 配列の局所な塩基再構成に依存する既存の手法の限界を克服し、潜在空間での意味的整合性を最適化する「GenoJEPA」という共同埋め込み予測アーキテクチャに基づくフレームワークを提案し、55 の下流タスクにおいて高い汎化性能と計算効率の両立を実現したことを報告しています。
本論文は、物理的な 3D 染色質相互作用と転写活性を統合的に解析し、偽陽性を排除して高信頼性の空間的遺伝子制御ネットワークを構築するオープンソース R パッケージ「Looplook」を開発し、機能ゲノミクスにおける標的遺伝子の割り当てと機能注釈を革新することを報告しています。
構造データが不要なシーケンス駆動型の Drug-Target 親和性予測モデル「XAttn-DTA」は、分子グラフと ESM2 予測コンタクトマップに基づくタンパク質グラフを双方向クロスアテンションで融合し、既存手法を大幅に上回る精度と未知の化合物・タンパク質ファミリーに対する汎化性能を実現しました。
この論文では、単一細胞解像度でモザイク短鎖反復配列(STR)変異を検出する新しいアルゴリズム「BayesMonSTR」を開発し、加齢に伴う脳神経細胞における STR 変異の蓄積やその機能的位置的特徴を明らかにすることで、疾患関連変異の発見と発育・加齢における STR 変異の未解明な側面を解明したことを報告しています。
がん細胞の薬剤応答予測において、交差検証前に全サンプルで特徴量選別を行う広範なデータリーク慣行が精度を過大評価し、生物学的シグナルではなく統計的アーティファクトを捉えることでバイオマーカー発見を歪めていることを、大規模データと文献監査を通じて実証し、その修正手法とガイドラインを提示しています。
長読長転写データを用いた V(D)J 再結合の包括的な解析を可能にする新規パイプライン「VDJcraft」を開発し、その精度向上、新規遺伝子サブクラスの発見、および COVID-19 患者における免疫応答動態の解明を実証しました。