Universal physical principles govern the deterministic genesis of protein structure
本研究は、アミノ酸の凝縮から機能的タンパク質の出現までの過程を支配する「組み立て」「創発」「相転移」という 3 つの普遍的物理原理を特定し、深層学習モデルのブラックボックスを解明する統一的な数学的枠組み「ProtGenesis」を提案することで、タンパク質構造の生成が決定論的な物理過程であることを明らかにした。
1250 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本研究は、アミノ酸の凝縮から機能的タンパク質の出現までの過程を支配する「組み立て」「創発」「相転移」という 3 つの普遍的物理原理を特定し、深層学習モデルのブラックボックスを解明する統一的な数学的枠組み「ProtGenesis」を提案することで、タンパク質構造の生成が決定論的な物理過程であることを明らかにした。
本論文は、Angiosperms353 ターゲット配列シーケンシングと HybPiper によるアセンブリを活用し、混合植物サンプルから種を高精度に同定するための新しい計算機・実験的アプローチ「SPrOUT」を提案し、その有効性を示したものである。
本研究は、12 種 8 種類の質量分析計から得られた 1,800 万枚以上のスペクトルを含む包括的なトップダウン質量分析スペクトルリポジトリ「TopRepo」を構築し、タンパク質プロteoform の網羅的解析や深層学習モデルを用いた高精度なスペクトル予測を可能にしたことを報告しています。
この論文は、単一細胞ゲノミクスデータを統合して構築した新しい知識グラフ「scPrimeKG」およびその上で学習されたモデル「CellAwareGNN」を提案し、既存のモデルと比較して自己免疫疾患を含む全疾患に対する薬剤適応症予測の精度と生物学的解釈性を大幅に向上させたことを示しています。
本論文は、がんの微小環境(TME)の構成成分から機械学習を用いてドライバー変異を予測する手法を開発し、TCGA などの大規模データセットおよび独立した外部コホートにおける汎がん研究とクロスプラットフォーム検証を通じて、TME の組成ががんドライバー変異を推論する上で十分な情報を含んでいることを実証したものである。
メタトランスクリプトミクスデータにおける複雑な細菌群集の解析向けに、配列リードを単一パスで分類群と発現遺伝子の両方に高精度に割り当てるナノチドアラインメントベースのフレームワーク「MetaTracer」が開発され、シミュレーションおよび実データ(歯垢)を用いた検証でその有効性が示されました。
本論文は、既知の真値を持つ現実的な糖質オミクスデータを生成し、手法の厳密なベンチマーキングを可能にするオープンソースの Python パッケージ「GlycoForge」を提案し、バッチ効果補正アルゴリズムの評価を通じてその有用性を示しています。
エチオピアの重要作物であるエナセ(Ensete ventricosum)の Mazia 品種のゲノムを新規に解読し、バナナとの比較を通じてエナセに特有の遺伝子群や機能的特徴を明らかにすることで、同作物の育種改善に向けた基盤を構築しました。
本研究は、再発性クロストリジオイデス・ディフィシル感染症に対する糞便微生物移植(FMT)の個人別治療反応を予測し、生物学的解釈性を維持しながら少量の縦断的マルチオミクスデータを統合するための新たな機械学習フレームワーク「HMOTP」を提案し、その有効性を検証したものである。
本論文は、低線量放射線被曝下での時間的変化を捉えるために、RNA シーケンシングデータと細胞ペインティング画像から得られた核形態特徴を結びつける解釈可能な逆モデルを開発し、放射線被曝による核形態の変化に関連する安定した転写産物予測因子を同定する手法を提案しています。