Differentiable Gene Set Enrichment Analysis for Pathway-Level Supervision in Transcriptomic Learning
本論文は、転写オミクス予測における遺伝子レベルの目的関数と経路レベルの解釈の不一致を解消するため、古典的 GSEA の統計的意味を維持しつつ微分可能で計算効率的な「dGSEA」手法を提案し、経路レベルの整合性を向上させることを示しています。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、転写オミクス予測における遺伝子レベルの目的関数と経路レベルの解釈の不一致を解消するため、古典的 GSEA の統計的意味を維持しつつ微分可能で計算効率的な「dGSEA」手法を提案し、経路レベルの整合性を向上させることを示しています。
本論文は、Oxford Nanopore シーケンシングを用いてヒトゲノム内の反復配列(リピート)の遺伝的・エピジェネティックな変異を包括的かつ同時に解析するための、ユーザーフレンドリーでスケーラブルなパイプライン「ECHO」を開発したことを報告しています。
本研究は、トランスフォーマー型ニューラルネットワークを用いて細胞間の通信連鎖をモデル化し、空間トランスクリプトミクスデータから生物学的に意味のある細胞間通信プログラムを同定するとともに、スポットおよび単一細胞レベルで通信のホットスポットを局在化する新しいフレームワーク「scCChain」を提案するものである。
この論文は、500 万のウイルス配列で事前学習されたファウンデーションモデル「HViLM」を提案し、LoRA による効率的な微調整を通じて病原性、宿主特異性、伝播性の 3 つの疫学的特性を高い精度で予測できることを実証したものである。
本論文は、UK バイオバンクのデータを用いて、稀な変異の関連性検出における機械学習ベースのアノテーション手法(CADD、AlphaMissense など)を体系的に評価し、検出力と較正の観点から最適な手法選択の実践的指針と較正評価のための分布論的枠組みを確立したものである。
この論文は、複数の変異影響予測ツール間の不一致を指標として用いることで、実験的データ(MAVEs)の価値が最も高まるタンパク質を特定し、変異解釈の効率化を図る戦略を提案しています。
ISdetector は、軟クリップリードのクラスター化と IS クリーン参照戦略を組み合わせて、短リードシーケンシングデータから挿入配列の正確な挿入部位および付随する構造変異を高精度に検出する、スケーラブルなバイオインフォマティクスパイプラインです。
Pro2RNA は、タンパク質配列と宿主生物の分類学的情報を統合したマルチモーダル逆翻訳言語モデルとして、特定の宿主に最適化された mRNA コーディング配列を生成し、既存の手法を上回る性能を示す革新的なフレームワークを提案しています。
本論文は、分布シフト下でのゲノム言語モデルの信頼性を向上させるため、温度スケーリングやエピステミック・ニューラルネットワークといった不確実性定量化手法の有効性を多様なゲノムおよびメタゲノム予測タスクにおいて検証し、分類の信頼性向上を実証したものである。
本論文は、事前学習されたゲノム言語モデル「Evo2」の埋め込み表現を用いてファージ宿主を予測する手法を提案し、既存の配列相同性や k-mer 法と組み合わせることで、特に宿主の移動遺伝子要素が少なく中程度のゲノム長を持つファージにおいて、宿主範囲の予測精度を向上させることを示しています。