Unique molecular identifiers don't need to be unique: a collision-aware estimator for RNA-seq quantification
本論文は、より短く非ユニークなUMIを用いて正確なRNA-seq定量を可能にする衝突を考慮したモーメント法推定量を提案し、生物学的知見を損なうことなくシーケンシングおよび合成コストを削減するものである。
763 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、より短く非ユニークなUMIを用いて正確なRNA-seq定量を可能にする衝突を考慮したモーメント法推定量を提案し、生物学的知見を損なうことなくシーケンシングおよび合成コストを削減するものである。
GlyComboCLI は、質量分析データのグリカン組成割り当てを自動化する柔軟なオープンソースのコマンドラインツールであり、手動による解釈を大幅に削減しつつ再現性のある結果を保証する、FAIR 準拠でスケーラブルなバイオインフォマティクスワークフローを可能にします。
本論文は、BRAKER3 や AUGUSTUS などの既存の手法と比較して、多様な真菌ゲノムにおける遺伝子および代替転写産物の予測の精度、感度、生物学的完全性を大幅に向上させる高速かつオープンソースの深層学習ツールである geneML を紹介する。
本論文は、大規模および単一細胞質量分析プロテオミクスにおいて欠損値を直接処理しつつ離散的なバッチ効果と連続的な信号ドリフトを同時に補正し、既存の手法と比較して生物学的構造を保持し情報損失を低減する統合統計フレームワークであるNMFBatchを導入する。
ParaDISM は、複数の配列アライメントを用いて曖昧さを解消する位置を同定し、参照配列を反復的に精緻化することで、高い相同性を有するゲノム領域におけるショートリードのアラインメントおよびバリアントコールの精度を向上させるオープンソースのパイプラインであり、これにより標準的なアライナーと比較してアラインメントの誤りや偽陽性のバリアントコールを著しく低減する。
zFISHer は、オープンソースの napari ベースのアプリケーションであり、逐次多重 FISH データの 3D 登録、検出、および共局在解析を自動化するとともに、手動分析の労働集約的なボトルネックを克服するための対話的なキュレーションツールを提供します。
OmniCellAgent は、非計算系研究者向けに、多様な単一細胞 RNA シーケンシングデータセットと生物医学的先行知識を自律的に取得・統合し、証拠に基づく仮説を生成してオミクス駆動の科学的発見を加速させるマルチエージェント AI フレームワークです。
本研究は10万を超えるインフルエンザウイルス配列から系統発生樹を構築し、ウイルスプロテオム全体における部位特異的な中立突然変異率と適合度効果を推定することで、突然変異タイプ間の有意な変異、SARS-CoV-2およびHIVとの強いウイルス間相関を明らかにし、自然におけるインフルエンザウイルスの進化を形作る突然変異と選択の理解のための包括的かつ対話型の資源を提供する。
著者らは、テロメア生物学障害に関連する hTERT ミスセンス変異を正確に分類するために配列および構造的特徴を統合した機械学習ツール「CharacTERT」を開発し、既存の予測ツールを上回る性能を発揮するとともに、無料でアクセス可能な Web サーバーを通じて包括的な変異風景を提供した。
本論文は、高度な計算スキルを必要とすることなく、実験研究者が統合されたトランスクリプトミクス、プロテオミクス、およびメタボロミクスデータセットから探索、可視化、仮説生成を可能にすることによってマウス老化の統合的多オミクス解析を民主化する、ユーザーフレンドリーでインタラクティブなR ShinyプラットフォームであるShiny AMMOAを紹介する。