Calibration of in-frame indel variant effect predictors for clinical variant classification
本論文は、臨床的変異分類におけるインフレーム挿入・欠失(indel)変異予測ツールの性能評価と、ACMG/AMP ガイドラインに基づく閾値の較正を行い、これらが臨床的価値を持つ一方でミスセンス変異予測ツールに比べて性能が低いことを明らかにしました。
1235 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、臨床的変異分類におけるインフレーム挿入・欠失(indel)変異予測ツールの性能評価と、ACMG/AMP ガイドラインに基づく閾値の較正を行い、これらが臨床的価値を持つ一方でミスセンス変異予測ツールに比べて性能が低いことを明らかにしました。
本論文は、多癌種コホートにおける免疫療法予後予測において、臨床変数が遺伝子特徴よりも支配的な役割を果たし、TMB などのゲノムデータの統合による予後予測性能の向上は限定的であることを示しています。
本論文は、ラベル付けが不完全な適応免疫受容体データ解析の課題を解決するため、免疫ML(immuneML)の新たなリリースを通じて、教師なし機械学習を用いた一貫したクラスタリング、解釈可能な生成モデル、プロテイン言語モデルとの統合、および可視化などの包括的なフレームワークを提案し、その有用性を複数の実用例で実証したものである。
本研究では、高密度な多オミクス時系列データから時間的な因果関係を推論するための計算フレームワーク「LagCI」を開発し、その有効性を生理学的データおよびヒトの多オミクスデータを用いて実証し、代謝と免疫応答のタイミングを調整する分子ハブの同定に成功したことを報告しています。
本研究は、微生物群集の個体数分布がガンマ分布に従うというマクロ生態学的パターンが、個々のパッチ内では再現されないものの、空間的に分断されたメタコミュニティにおけるパッチ間での集約によって説明可能であることを示し、観測される分布が生物学的メカニズムそのものではなく、空間的な粗視化(サンプリング)に起因する可能性を提唱しています。
この論文は、16S rRNA の k-mer 配列構成が微生物の機能的潜在性を反映していることを発見し、分類群の割り当てなしに直接機能を予測できるニューラルネットワーク基盤のツール「embeRNA」を開発・検証したことで、未研究環境における微生物群集の機能解析を大幅に改善できることを示しています。
本研究は、Thompson サンプリングに基づく能動学習戦略を用いることで、AlphaFold2 によるペプチド結合スクリーニングを効率的に行い、全結合体を 50% 発見するために必要な計算リソースを全数検索の 15% まで削減できることを示しています。
本論文は、高解像度 3D 構造の不足という課題を、6 万 1 千を超える自己完結型 RNA 単位(SCRUs)のデータベース「SCRU-DB」の構築と、これに基づく直接予測モデル「SCRU-Seq」および拡散モデル「SCRU-Diff」の開発により解決し、高精度かつスケーラブルな RNA 配列設計を実現したことを報告しています。
NetSyn は、配列類似性だけでなく保存されたゲノム文脈(シントニー)に基づいてタンパク質ファミリーを分類し、新規代謝経路の発見や機能予測の精度向上を可能にするバイオインフォマティクスツールとして開発された。
この論文は、単細胞トランスクリプトミクスデータの次元削減の信頼性を向上させるため、スケーラビリティと公平性に優れた評価フレームワーク「ViScore」と、マルチスケール構造を保存し解釈可能性を備えた深層学習モデル「ViVAE」の 2 つのツールを導入し、その有効性を実証しています。