DOTSeq enables genome-wide detection of differential ORF usage
本研究は、リボソームプロファイリング実験において遺伝子レベルではなくオープンリーディングフレーム(ORF)レベルで翻訳調節を検出・定量化するための統計フレームワーク「DOTSeq」を開発し、ORF 使用率の変化(DOU)と翻訳効率(DTE)を包括的に解析するエンドツーエンドのワークフローを提供することを示しています。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、リボソームプロファイリング実験において遺伝子レベルではなくオープンリーディングフレーム(ORF)レベルで翻訳調節を検出・定量化するための統計フレームワーク「DOTSeq」を開発し、ORF 使用率の変化(DOU)と翻訳効率(DTE)を包括的に解析するエンドツーエンドのワークフローを提供することを示しています。
本論文は、核酸合成のバイオセキュリティリスク管理における「懸念配列」の定義の欠如を解消するため、ステークホルダーによる科学的レビューを経て、病原体や毒素の配列を特定するための基準(ルブリック)を策定し、既存のスクリーニングシステム間の合意を高め、バイオセキュリティ政策の基盤となる具体的な定義を提供したものである。
この論文は、微生物叢の差異発現解析において、負の二項分布に基づく手法が過剰な有意性を示す傾向がある一方で、古典的な統計検定がより信頼性の高い結果をもたらすことを、置換法を用いた包括的な評価を通じて明らかにしています。
この論文は、アミノ酸配列からミリ秒単位でタンパク質の接触マップを予測する高速な生成モデルを開発し、二次構造要素への粗視化表現とフローマッチングを活用することで、タンパク質のトポロジカルな特徴を高精度に捉え、変異体の構造探索を可能にする手法を提案しています。
本論文は、PRIDE データベースから大規模な質量分析プロテオミクスデータを自動的に収集・構造化し、機械学習モデルの再訓練に直接活用可能な大規模データセットを迅速に構築するスケーラブルなフレームワーク「usiGrabber」を提案し、その有効性をリン酸化特異的分類器の再訓練による実証で示したものです。
本研究では、バッチ RNA シーケンスデータから単一細胞レベルの転写プロファイルを再構築するデコンボリューション手法「DeSCENT」を提案し、TCGA の 8 つの癌コホートにおける生存分析において、従来のバッチデータのみや細胞情報単独を用いたモデルよりも優れた性能を示したことを報告しています。
Ryder は、安定した内部参照領域を活用する 2 段階モデルを採用し、スパイクイン対照の有無を問わず多様なエピゲノムデータに対して技術的変動を補正し、生物学的シグナルの検出精度を向上させる Python パッケージです。
この論文は、Spectral Burrows-Wheeler Transform (SBWT) を基盤とし、可変長の k-mer に対して階層的な特徴注釈を正確かつ損失なく行い、多対一致や新規配列の問題を解決する新たなデータ構造「HKS」を提案し、ヒトゲノムアノテーションにおける高い精度と既存ツールとの同等の処理速度を実証したものである。
本論文は、特許文書に埋もれていた構造化されていない生体活性データを自律的な AI マルチエージェントシステム「HARVEST」によって効率的に抽出・構造化し、既存データベースに存在しない膨大な新規化合物とタンパク質ターゲットを解明するとともに、そのデータを用いた評価により既存モデルの構造的・機能的な一般化限界を明らかにしたものである。
IAV の公衆衛生リスクに対処するため、k-mer 法では失われがちな連結情報を保持し、統計的信頼性をもって混合感染や遺伝子再集合を高精度に検出する新しい確率的フレームワーク「PREMISE」が開発された。