MOAflow: how re-design a pipeline with Nextflow streamlines data analysis
この論文は、Nextflow とコンテナ技術を活用して MNase 定義シストローム占有(MOA-seq)データ解析パイプラインを再設計した「MOAflow」を開発し、その移植性、再現性、および計算効率の向上を実証したものである。
768 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、Nextflow とコンテナ技術を活用して MNase 定義シストローム占有(MOA-seq)データ解析パイプラインを再設計した「MOAflow」を開発し、その移植性、再現性、および計算効率の向上を実証したものである。
AI によるタンパク質構造予測を用いた本研究は、脊椎動物の TLR2 におけるリガンド結合ポケットの保存性と進化、および無脊椎動物における同様の構造が収斂進化によって独立して生じたことを明らかにしました。
本論文は、構造化された生物学的記述(細胞種、組織、マーカー遺伝子など)から単細胞遺伝子発現プロファイルを生成する新しいパイプライン「CLOP-DiT」を提案し、テキストと細胞データの対照的アライメントと拡散トランスフォーマーを用いた条件付き生成の可行性を実証したものである。
本研究は、抗 NMDA 受容体脳炎の原因となる自己抗体を中和するデコイとして機能する合成ペプチド Mimetic の設計と、AlphaFold2 や HADDOCK などの計算手法を用いた結合親和性の評価を行い、その有効性を示唆したものです。
この論文は、移植後の白血病患者における微小残存病変(MRD)やマイクロキメリズムなどの研究において、単一細胞 RNA シーケンスデータから極めて稀な外来遺伝子型細胞(0.05% 以下)を検出するための計算手法「Cellector」を提案し、その高い精度を実証したものである。
この論文は、メタゲノムデータとメタボロームデータを統合し、既知の代謝ネットワークを活用して疾患特異的な微生物代謝モジュールを同定する計算フレームワーク「MAAMOUL」を提案し、炎症性腸疾患や過敏性腸症候群において従来の手法では見逃されていた機能的な変化を明らかにしたことを報告しています。
本研究は、タンパク質の多重的な細胞内局在を高精度に予測するために、カスケード型デュアル・トランスフォーマー構造を用いたフルパラメータ微調整モデル「DualLoc」を開発し、既存手法を上回る性能と生物学的に妥当な細胞区画間の相関を明らかにしたことを報告しています。
この論文は、変異影響予測ツールやマルチプレックスアッセイの臨床的有用性を従来の識別指標ではなく、ACMG/AMP ガイドラインに基づく「平均証拠強度(MES)」という新たな定量的指標を用いて評価する枠組みを提案し、MAVEs や CPT-1 などの手法が VUS(意義不明変異)の解釈において高い臨床証拠を提供できることを示しています。
CRISPR 遺伝子編集の長リードアンプリコンシーケンシングデータから、ベクター統合や構造変異を含む多様な編集結果を包括的に分類・定量化するスケーラブルなパイプライン「ALPINE」を開発し、その高精度と臨床応用への有用性を示しました。
本論文は、大規模な転写組データを用いて敗血症を免疫および代謝特性に基づき 4 つの分子サブタイプに分類し、各サブタイプに特異的な遺伝子シグネチャを同定することで、メチレンブルーやモノクローナル抗体など、従来の臨床試験の失敗要因を説明しつつ個別化医療を実現する可能性のある薬剤転用候補を特定したことを示しています。