The gift of novelty: repeat-robust k-mer-based estimators of mutation rates
この論文は、高度な反復配列に頑健な新しい k-mer ベースの突然変異率推定法を 3 つ提案し、アルファ衛星配列を用いた実証評価において既存の手法を上回る性能を示したことを報告しています。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
この論文は、高度な反復配列に頑健な新しい k-mer ベースの突然変異率推定法を 3 つ提案し、アルファ衛星配列を用いた実証評価において既存の手法を上回る性能を示したことを報告しています。
本研究は、TCGA の肝細胞癌(HCC)多オミクスデータを用いて、注意機構を備えた解釈可能な深層学習モデルを開発し、臨床変数や既存モデルを上回る予後予測精度と生物学的に妥当なバイオマーカーの同定を実現したことを報告しています。
本論文は、動物、植物、菌類にまたがる転移因子の分類を可能にする、統合データベースとモジュール型ベンチマークプラットフォームを組み合わせた深層学習フレームワーク「PanTEon」を開発し、分類器の性能評価の標準化と再現性の向上を図ったことを報告しています。
本論文は、1,000 以上のヒトがん細胞株における CRISPR スクリーンデータに基づき、既知の生物学的注釈に依存せず遺伝子間の機能的な依存関係をデータ駆動で探索・分析できる無料の Web アプリケーション「Correlate」を提案しています。
DIA プロテオミクスにおける欠損値処理の新たな手法「Nettle」は、従来の数値補完ではなくペプチドの保持時間境界を推定して積分することで、より正確な定量性や検出感度の向上を実現します。
CellWHISPER は、細胞タイプの発現や空間的構造という交絡因子を統計的に補正し、大規模な空間トランスクリプトミクスデータから誤りを厳密に制御しながら直接的な細胞間コミュニケーション(ギャップ結合やリガンド - 受容体など)を効率的に推論する新しい枠組みであり、マウス脳データやアルツハイマー病モデルへの適用を通じて既存手法では検出困難な重要な相互作用や疾患関連シグナルを同定しました。
この論文は、生物学的に適切なデータ分割を用いて評価された文脈認識型タンパク質埋め込みフレームワーク「GATSBI」を提案し、既存の手法よりも特に未研究タンパク質の予測性能を大幅に向上させることを示しています。
本論文は、転移学習やプライバシー制約のある環境でも適用可能な、ソマティック変異データに基づく腫瘍分類のためのポータブルなトランスフォーマーベース手法「muat」を開発し、Docker や Bioconda 経由での配布、および Genomics England などの安全な処理環境での実証を通じてその汎用性と高精度を確立したことを報告しています。
本論文は、従来のサイトごとの平均化では見逃されてきた連続的なメチル化パターンを復元し、Sanger 法および次世代シーケンシングデータから単一分子レベルのエピアレルを解析するための統合的なパイプライン「PANDA」を提案し、その精度と有用性を検証したものである。
OncoMORPHIA は、10 の公共データベースからデータを統合し、がん変異の 3 次元構造可視化、臨床注釈、生存分析、AI による解釈などを単一のブラウザベースのプラットフォームで提供し、専門的なバイオインフォマティクス知識を必要とせずに研究者ががん変異を包括的に探索できるようにする無料の Web ツールです。