Correlate: A Web Application for Analyzing Gene Sets and Exploring Gene Dependencies Using CRISPR Screen Data
本論文は、1,000 以上のヒトがん細胞株における CRISPR スクリーンデータに基づき、既知の生物学的注釈に依存せず遺伝子間の機能的な依存関係をデータ駆動で探索・分析できる無料の Web アプリケーション「Correlate」を提案しています。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、1,000 以上のヒトがん細胞株における CRISPR スクリーンデータに基づき、既知の生物学的注釈に依存せず遺伝子間の機能的な依存関係をデータ駆動で探索・分析できる無料の Web アプリケーション「Correlate」を提案しています。
本研究では、snoRNA と RNA 結合タンパク質の物理的・機能的な相互作用を統合したネットワークモデル「snoFlake」を開発し、スプライソソーム構成因子と結合してスプライシングを調節する新たな snoRNA(SNORD22)の機能を同定することで、snoRNA の役割がリボソーム修飾から広範な転写後調節へと拡張されることを示しました。
本論文は、ロータウイルスの VP4 遺伝子を標的とした siRNA を、構造情報と分子動力学シミュレーションを統合した計算手法により設計・評価し、RISC 複合体との安定な相互作用を示す最適な候補を特定したことを報告するものである。
DIA プロテオミクスにおける欠損値処理の新たな手法「Nettle」は、従来の数値補完ではなくペプチドの保持時間境界を推定して積分することで、より正確な定量性や検出感度の向上を実現します。
65 種の被子植物ゲノムで事前学習された植物特異的な DNA 基盤モデル「PlantCAD2」は、大規模なモデルを凌駕する精度で進化的保存性やクロマチン構造などを予測し、多様な植物種におけるゲノム機能解読を可能にします。
本論文では、全ゲノムシーケンシングデータを用いた病原体の迅速な同定と集団ゲノム解析を可能にする、オープンソースかつ自動化された Nextflow パイプライン「PathogenSurveillance」を提案しています。
CellWHISPER は、細胞タイプの発現や空間的構造という交絡因子を統計的に補正し、大規模な空間トランスクリプトミクスデータから誤りを厳密に制御しながら直接的な細胞間コミュニケーション(ギャップ結合やリガンド - 受容体など)を効率的に推論する新しい枠組みであり、マウス脳データやアルツハイマー病モデルへの適用を通じて既存手法では検出困難な重要な相互作用や疾患関連シグナルを同定しました。
この論文は、mRNA 配列のみを入力として、構造を考慮したシミュレーションと機械学習を組み合わせたハイブリッド手法「seq2ribo」を開発し、リボソームの位置プロファイルやタンパク質発現量を高精度に予測可能にしたことを報告しています。
この論文は、細胞種を超えた時間的 scRNA-seq データにおいて、遺伝子の時間的軌跡の一貫性を定量化する「動的整合性指数(DCI)」を導入し、これに基づいて遺伝子を選択することで、確率的な再帰ニューラルネットワークを用いた高精度かつ不確実性を考慮した遺伝子発現予測を実現することを示しています。
この論文は、生物学的に適切なデータ分割を用いて評価された文脈認識型タンパク質埋め込みフレームワーク「GATSBI」を提案し、既存の手法よりも特に未研究タンパク質の予測性能を大幅に向上させることを示しています。