Active Learning for Budget-Constrained TCR--pMHC Wet-Lab Validation
本論文は、TCR-pMHC 結合のウェットラボ検証コストを削減するため、不確実性と多様性を組み合わせた能動学習戦略「UDAL」を提案し、限られた実験予算でランダムサンプリングよりも効率的に予測モデルの精度を向上させることを実証しています。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、TCR-pMHC 結合のウェットラボ検証コストを削減するため、不確実性と多様性を組み合わせた能動学習戦略「UDAL」を提案し、限られた実験予算でランダムサンプリングよりも効率的に予測モデルの精度を向上させることを実証しています。
本論文は、HLA アレルやコホート層におけるデータ偏りによる予測格差を解消するため、グループ分布ロバスト最適化(GDRO)フレームワーク「FairTCR」を提案し、最悪グループの性能を維持しつつ平均性能を低下させずに公平性を大幅に向上させたことを示しています。
この論文は、ベネズエラ・ボリバル州の不完全な蚊の観測データに機械学習を適用して欠損値を補完し、その結果を気候変数と組み合わせてマラリア発生を予測するモデルを構築したところ、P. vivax の予測精度向上に成功したが P. falciparum の予測には至らなかったことを報告しています。
本研究は、統計解析、機械学習、自動文献レビューを統合した多エージェント AI フレームワーク「ORION」を開発し、複雑な免疫プロファイリングデータの解釈を数ヶ月から数時間へ短縮し、新たな生物学的仮説の生成を可能にしたことを報告しています。
本論文は、タンパク質言語モデルを用いた条件付き生成フレームワークにより、特定のコンフォメーション集合記述子に基づいた内在性無秩序タンパク質(IDR)の設計が可能であることを示したが、その精度向上には大規模なデータセットが不可欠であり、データ量が IDR 設計における主要な限界要因であることを明らかにした。
本論文は、Go 言語で実装されたゼロアロケーションのストリーミングフィルタ「vcfilt」を紹介し、大規模な VCF データの品質フィルタリングにおいて bcftools を最大 12.2 倍高速化しつつ、出力の完全な互換性を維持することを示しています。
抗体のコンフォメーション・アンサンブルを高精度にサンプリングし、実験的証拠と照合して状態最良の性能を示す生成モデル「ABB4-STEROIDS」が新たに開発され、大規模な抗体コンフォメーション研究のためのオープンなリソースとして提供されました。
本研究は、異なる温度環境に生息する Xenopus 属の 2 種(X. laevis と X. tropicalis)において、エンドヌクレアーゼ G(EndoG)タンパク質のアミノ酸組成や立体構造特性に顕著な適応進化が見られ、温度がその多様化を支配する主要な要因であることを明らかにした。
ProteomeScan は、クラウド規模の高性能計算を活用してヒトプロテオム全体にわたる分子ドッキングシミュレーションを行い、既存の計算手法の限界を克服し、潜在的なタンパク質 - リガンド相互作用を特定・検証するための大規模な計算ツールキットとして開発され、その有効性が確認された。
本論文は、空間イメージングプロテオミクスデータから病状予後に関連する免疫微小環境を自動的に同定し、脳がんの生存予後に関連する細胞間コミュニケーションを解明する新しいオープンソースツール「MICRON」を提案するものである。