Decoding conformational heterogeneity across disordered proteomes
本研究は、深層学習と物理的アセンブリを統合した新たなフレームワーク「AI-IDP」を開発し、イントリンシクスに無秩序なタンパク質の構造的な多様性を実験データと整合するアンサンブルとして高精度に予測・解明し、その機能や疾患関連メカニズムの理解を可能にしたことを報告しています。
1244 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、深層学習と物理的アセンブリを統合した新たなフレームワーク「AI-IDP」を開発し、イントリンシクスに無秩序なタンパク質の構造的な多様性を実験データと整合するアンサンブルとして高精度に予測・解明し、その機能や疾患関連メカニズムの理解を可能にしたことを報告しています。
Grass Expression Atlas (GExA) は、4 種のキビと 2 種のモデル植物(大麦・ソルガム)を対象に、統一された RNA-seq 解析パイプラインで処理された 4,673 サンプルの遺伝子発現データを統合し、ユーザーフレンドリーな Web 界面を通じて提供し、将来的な種拡大も視野に入れた草類植物の発現リソースである。
この論文は、タンパク質言語モデルの埋め込みとグラフニューラルネットワークを活用して、タンパク質複合体の化学量論(構成タンパク質の分子数)を高速かつ高精度に予測する新しい手法「Stoic」を提案しています。
本論文は、対照的アライメントを用いた潜在空間ベイズ最適化フレームワーク「PepCABO」を提案し、複数の MHC アレル間での知識転移を可能にすることで、限られた実験予算下でもペプチド -MHC 結合の効率的な最適化を実現することを示しています。
この論文では、老化や糖尿病の合併症に関与する非酵素的な糖化終末産物(AGE)架橋を原子レベルのコラーゲン原線維モデルに組み込むための ColBuilder フレームワークの拡張版を提案し、そのパラメータの妥当性を検証するとともに、酵素架橋との機械的応答の違いを実証しています。
本論文は、タンパク質の分解と品質管理を担うユビキチン・プロテアソーム系(UPS)および分子シャペロンやオートファジー経路を含むより広範なタンパク質ホメオスタシス網(PN)を包括的に調査し、ヒトにおいてそれぞれ約1400種および3100種以上の構成要素からなることを明らかにし、ゲノム科学から疾患研究に至る多岐にわたる分野への応用を支援する基盤を提供するものである。
本研究は、多様な特徴符号化とハイブリッド CNN-Transformer 構造を統合した深層学習フレームワーク「LysinFusion」を開発し、既存手法を上回る精度でファージリシンを同定し、その予測の生物学的妥当性を示すことを報告しています。
本研究は、2,428 個の実験的検証済み siRNA データセットを用いて機械学習モデルを開発し、特に 5'末端のウラシルと 3'末端のアデニンといった位置特異的塩基配列が siRNA の効力を決定する主要因であることを明らかにすることで、既存の手法よりも予測精度と生物学的解釈性を向上させた新しい siRNA 設計フレームワークを提案しています。
この論文は、大規模なハプロタイプパネルにおいて、単一の圧縮インデックス上で任意の(k, L)閾値を適用して生物学的に意味のある長距離共有祖先領域を効率的に検出する新アルゴリズム「PBML」を提案し、既存手法よりも大幅に高速かつメモリ効率よく動作することを示しています。
この論文は、高スループットな環境共分散行列を活用して遺伝子型と環境の相互作用(GEI)に解釈可能な方向性構造を持たせる「ベイズ AMMI ベースの GEI シミュレーション枠組み」を提案し、その有効性を検証したものである。