A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization
この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク(TCN)を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。
29 件の論文
この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク(TCN)を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。
scRNA-seq と snRNA-seq の間における細胞タイプ注釈の課題を解決するため、分布や細胞構成の違いに対処する部分ドメイン適応を採用した新しい手法 ScNucAdapt を提案し、既存手法を上回る頑健な注釈精度を達成したことを示しています。
本論文は、複雑なオミクス実験結果の標準化された管理と共有を可能にするため、Bioconductor 生態系内で開発され、SingleCellExperiment オブジェクトを拡張して発現解析や機能富化解析の結果を一元管理する新しい S4 クラス「DeeDeeExperiment」を紹介するものである。
この論文は、openSNP データセットの 80 種類の二値表現型を用いて 29 の機械学習アルゴリズム、80 の深層学習アルゴリズム、および 3 つの多遺伝子リスクスコアツールをベンチマークし、それぞれの特徴や表現型に応じた性能差を明らかにしたものである。
この論文は、機械学習および深層学習を用いて遺伝子型データから症例/対照を分類し、特徴量の重要度に基づいて表現型に関連する遺伝子を同定するパイプラインを提案し、その有効性をオープンデータと GWAS カタログとの比較により実証したものである。
SeekRBP は、強化学習に基づく動的な負のサンプリング戦略とシーケンス・構造情報の統合を活用することで、従来の同源性ベース手法や既存の機械学習アプローチが困難とする受容体結合タンパク質(RBP)の高精度な同定を実現する新しいフレームワークです。
この論文は、Klf4 の物理的結合エネルギーを測定し、統計力学モデル(線形モデルとイジングモデルの組み合わせ)を用いて解析することで、in vitro の結合エネルギーデータが追加の fitting パラメータなしでヒトゲノム全体における Klf4 の占有パターンを正確に予測できることを実証したものである。
本論文は、遺伝子発現の基礎モデル(Geneformer V2-316M および scGPT)におけるスパース自己符号化器(SAE)特徴量間の因果的相互作用を解析する「因果回路追跡」手法を提案し、モデル間で生物学的整合性や抑制優位性が保存されていること、疾患関連ドメインの特定、および CRISPRi による検証を通じて共発現パターンの確認を実証したものである。
この論文は、機械学習を用いて複雑な微生物群集の機能を少数のグループに要約し、土壌や海洋、腸内などの環境における構造と機能の関係を解明する統合的な手法を提案しています。