EGGS: Empirical Genotype Generalizer for Samples
EGGS は、欠損データを含む実証的な遺伝子型を受け取り、その分布を複製に反映させるとともに、位相や極性の除去、脱アミノ化やシーケンシングエラーのシミュレーション、疑似ハプロイドの作成、および各種データ形式間の変換など、集団遺伝学解析に必要な多機能な処理を提供する C 言語製のツールです。
769 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
EGGS は、欠損データを含む実証的な遺伝子型を受け取り、その分布を複製に反映させるとともに、位相や極性の除去、脱アミノ化やシーケンシングエラーのシミュレーション、疑似ハプロイドの作成、および各種データ形式間の変換など、集団遺伝学解析に必要な多機能な処理を提供する C 言語製のツールです。
本論文は、単一細胞 RNA シーケンシングデータから細胞周期のような振動プロセスを考慮した遺伝子制御ネットワークを推論する新規フレームワーク「CycleGRN」を提案し、既知のネットワーク構造を持つ合成データおよびマウス網膜前駆細胞の実データを用いた評価において、既存手法を上回る振動性と方向性の相互作用の回復性能を実証したものである。
本論文は、集団規模の単一細胞マルチオミクスデータから高解像度の「特徴×サンプル」結合埋め込みを学習し、条件間での調節ネットワークの再編成の検出、患者サブタイプの発見、臨床転帰の予測を可能にする包括的フレームワーク「MOSAIC」を提案するものである。
本論文は、14 の公共リソースを統合した大規模知識グラフと対照学習を用いた事前学習戦略により、未プロファイルの化合物に対するゼロショット予測を可能にする知識駆動型フレームワーク「MAP」を提案し、単細胞応答予測の精度向上と抗がん剤候補の優先順位付けに成功したことを報告しています。
本論文は、空間座標、組織画像、分子プロファイルを統合するグラフ対照学習手法「SpaMOAL」を提案し、空間マルチオミクスデータから高精度な組織領域を同定できることを示しています。
この論文は、最適輸送理論に基づくフレームワークを単細胞 RNA シーケンシングデータに適用することで、急性ウイルス感染に対するマウス CD8 T 細胞の時間的・組織的な分化動態と組織定着性記憶 T 細胞への移行経路を解明し、AP4 などの転写因子の役割や CD52 を用いた新規マーカーの同定を通じて、免疫細胞の運命決定メカニズムを定量的に描き出したことを報告しています。
本論文では、MPRA 実験における DNA と RNA のカウント間およびバッチ間の不確実性の差異を適切に扱えない既存手法の課題を解決し、Keju という階層統計モデルを提案することで、感度の向上と偽陽性率の低減を実現したことを報告しています。
この論文は、高次元オミクスデータにおける機械学習分類の課題を解決するため、確率的な理論的保証を持つフィルタベースの「確実スクリーニング(sure screening)」手法を包括的にレビューし、実データを用いたベンチマーク評価を通じて、計算効率と性能の両面で優れている「BcorSIS」手法を特定したことを報告しています。
この論文は、単一細胞トランスクリプトミクスにおける細胞タイプの階層的整合性を確保し、従来の手法の限界を克服するために、遺伝子発現プログラムに基づく厳密な階層構造を構築する新しい手法「GeCCo」を提案し、その有効性を免疫アトラスや膵臓前駆細胞のデータで実証したものである。
本論文は、単一細胞マルチオミクスデータの複雑さを解きほぐすため、グラフベースのトピックモデリング手法「bionSBM」を提案し、既存の最先端手法を上回るクラスタリング精度と生物学的解釈性を示したものである。