The Rayleigh Quotient and Contrastive Principal Component Analysis II
この論文は、空間 PCA のカーネル重み付けと基底関数係数空間における解法という 2 つの拡張を導入し、空間的および機能的な手法を統一的な枠組みで統合した対照主成分分析(cPCA)の新たな応用を、がんやワクチン接種への免疫反応に関するゲノムデータの分析例を通じて示しています。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、空間 PCA のカーネル重み付けと基底関数係数空間における解法という 2 つの拡張を導入し、空間的および機能的な手法を統一的な枠組みで統合した対照主成分分析(cPCA)の新たな応用を、がんやワクチン接種への免疫反応に関するゲノムデータの分析例を通じて示しています。
この論文は、参照データベースに依存せず、2,597 件のシーケンスデータで訓練された深層学習モデル「DIANA」を開発し、未知の分類群を含む古代メタゲノムサンプルの宿主や試料種などのメタデータを高精度に予測・検証可能にしたことを報告しています。
本研究は、ウイルス標的ヒトタンパク質の相互作用界面において、正の選択がクラスター化し負の選択が広範囲に分散するという空間的な選択圧の多様性を解明し、特に宿主内パートナーとウイルスの両方に結合する「ミミック標的」界面が適応進化の焦点となっていることを示しています。
本論文は、単一細胞転写データから細胞周期や概日リズムなどの生物学的サイクルを細胞文脈に依存する周期的多様体としてモデル化し、細胞のアイデンティティとサイクルの相互作用を解明する汎用的かつ解釈可能なアルゴリズム「CoPhaser」を提案するものである。
本論文は、DNA を四元数信号として表現し、2 つの複素 FFT で計算可能な四元数フーリエ変換フレームワークを提案することで、従来の手法では検出できなかった DNA の螺旋反復周期やヌクレオソーム配置などの構造的特徴を、GPU 加速によりリアルタイムで検出可能なアライメント不要なゲノム解析手法を開発したことを報告しています。
メタゲノムアセンブリされたゲノム(MAG)パイプラインの包括的な評価フレームワーク「MAG-E」を開発し、ヒト腸内微生物叢におけるアセンブラやビンニングアルゴリズムなどの性能を厳密に検証することで、最適な手法の特定やプロファージなどの特定領域における性能ギャップの解明に成功した。
PoolParty は、複雑なオリゴプールの設計を簡素化し、計算グラフと柔軟な API を用いて多様な変異やモtif 挿入などを可能にする Python パッケージである。
この論文は、内耳遺伝学における曲線な文献や分散したリソースを統合し、自動エージェント支援キュレーション、ベイズ推定による候補遺伝子優先順位付け、説明可能な「ダーク遺伝子」支援関係、および科学エンティティネットワークを組み合わせた包括的な知識ベース「IEKB」を開発し、オープンアクセスで公開したことを報告するものである。
この論文は、GWAS 結果の遺伝子優先順位付けにおける多変量共線性の課題を克服し、NAFLD のケーススタディで既存手法 PoPS を凌駕する性能を示した、PLSR を統合した Nextflow ベースの次世代マルチオミクス統合パイプライン「GMIP-PLSR」の開発と有効性を報告しています。
本研究は、アクチグラフ睡眠検出アルゴリズムのパラメータ調整を人手から再現性の高いグリッドサーチに置き換える枠組みを提案し、多様なデータセットを用いた評価において睡眠タイミングの精度向上と微細な覚醒の処理改善を実証した。