Integrating targeted genome mining and structure-guided modeling reveals unexplored 7-deazapurine-containing pathways
本論文は、大規模なゲノムマイニングと構造ガイドモデリングを統合することで、7-デオキサプリン含有二次代謝産物の未解明な生合成経路を網羅的に発見し、その酵素機能と化学構造の関連性を解明した。
766 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、大規模なゲノムマイニングと構造ガイドモデリングを統合することで、7-デオキサプリン含有二次代謝産物の未解明な生合成経路を網羅的に発見し、その酵素機能と化学構造の関連性を解明した。
DOME Copilot は大規模言語モデルを活用して AI 手法の構造化レポートを自動抽出し、生命科学分野における AI 研究の透明性と再現性を簡素化する革新的なソリューションです。
本論文は、臨床的変異分類におけるインフレーム挿入・欠失(indel)変異予測ツールの性能評価と、ACMG/AMP ガイドラインに基づく閾値の較正を行い、これらが臨床的価値を持つ一方でミスセンス変異予測ツールに比べて性能が低いことを明らかにしました。
本論文は、多癌種コホートにおける免疫療法予後予測において、臨床変数が遺伝子特徴よりも支配的な役割を果たし、TMB などのゲノムデータの統合による予後予測性能の向上は限定的であることを示しています。
本研究では、高密度な多オミクス時系列データから時間的な因果関係を推論するための計算フレームワーク「LagCI」を開発し、その有効性を生理学的データおよびヒトの多オミクスデータを用いて実証し、代謝と免疫応答のタイミングを調整する分子ハブの同定に成功したことを報告しています。
本研究は、微生物群集の個体数分布がガンマ分布に従うというマクロ生態学的パターンが、個々のパッチ内では再現されないものの、空間的に分断されたメタコミュニティにおけるパッチ間での集約によって説明可能であることを示し、観測される分布が生物学的メカニズムそのものではなく、空間的な粗視化(サンプリング)に起因する可能性を提唱しています。
本論文では、天然アミノ酸に限定されるタンパク質モデルや化学モデルの限界を克服し、1 億以上の分子で学習された「PeptideCLM-2」という化学言語モデルの suite を提案し、治療用ペプチドの膜透過性、腫瘍ターゲティング、半減期などの開発指標予測において既存手法を上回る性能を実現したことを報告しています。
本研究は、エピトープ特定から生成、スコアリング、実験的検証までのエージェント支援ワークフローを用いて、実験構造や既知の抗体情報なしに新規がんターゲットに対するナノボディー結合体を設計し、ナノモルからサブナノモルレベルの親和性を持つ結合体を成功裏に獲得したことを示しています。
本研究は、GENCODE アノテーションの安定したサブセットを用いた不確実性意識ベンチマークと拡張特徴量解析により、mRNA と lncRNA の分類におけるツール間の不一致や誤分類の要因を解明し、より頑健な分類器の開発と分類不確実性の解釈に実用的な指針を提供する新たな枠組みを提示しました。
本研究は、タンパク質および代謝物データを統合してサンプル固有の代謝グラフを再構築し、その構造に基づいて大規模言語モデルを微調整するとともに、実験的証拠に基づく仮説探索(Oracle-in-the-Loop 推論)を通じて各推論ステップを検証する AI システム「PathwaySeeker」を開発し、非モデル生物 Trametes versicolor のデータを用いて、実験的に確認された代謝経路と検証が必要な仮説を明確に区別する新たなアプローチを提案したものである。