Molecular Fingerprints Are Strong Models for Peptide Function Prediction
この論文は、複雑な長距離相互作用のモデル化が不要であり、単純で解釈性の高い局所的な分子フィンガープリントとLightGBMの組み合わせが、ペプチド機能予測においてグラフニューラルネットワークやトランスフォーマーベースの手法を上回る性能を発揮することを、132のデータセットを用いた大規模な検証を通じて実証しています。
19 件の論文
この論文は、複雑な長距離相互作用のモデル化が不要であり、単純で解釈性の高い局所的な分子フィンガープリントとLightGBMの組み合わせが、ペプチド機能予測においてグラフニューラルネットワークやトランスフォーマーベースの手法を上回る性能を発揮することを、132のデータセットを用いた大規模な検証を通じて実証しています。
この論文は、タンパク質の幾何学と化学的性質を確率的に結合して対応付ける新しいフレームワーク「IFACE」を提案し、タンパク質表面の比較や機能的な相互作用パッチの検出を可能にする統合的な距離指標を確立したことを報告しています。
本論文は、原子レベルの基盤モデルから得られる中間特徴量を用いた局所タンパク質環境の新しい表現手法を提案し、これが二次構造や化学的特性を効果的に捉えるだけでなく、NMR 化学シフトの予測において最先端の精度を達成する物理情報に基づく予測器の構築を可能にしたことを示しています。
本論文は、従来の手法に比べて計算コストが低く手動調整が不要な、Cryo-EM 密度マップ制約を組み込んだワンステップ拡散モデル「CryoNet.Refine」を開発し、タンパク質複合体や DNA/RNA-タンパク質複合体の構造精密化を大幅に高速化・自動化する手法を提案しています。
この論文は、自然言語処理やコンピュータビジョンとは異なりスケーリングが不安定なタンパク質言語モデル(PLM)に対し、小規模モデルの表現を大規模モデルの埋め込みの最初の次元に一致させる「Reverse Distillation」というフレームワークを提案し、これにより埋め込み次元を固定したままモデルサイズが大きくなるほど性能が向上し、ProteinGym ベンチマークで SOTA 性能を達成することを示しています。
この論文は、アミノ酸組成と配列パターンを低次元の熱力学的メトリック空間にマッピングすることで、複雑な混合物における内在性無秩序領域(IDR)の相分離挙動や分配を、自由エネルギーや相共存データに依存せずに定量的かつ統一的に予測・理解できる新しい枠組みを確立したことを報告しています。
BInD は、拡散モデルと知識ベースのガイダンスを活用して分子とそのタンパク質との相互作用を共生成し、標的特異的な相互作用、分子特性、局所幾何学といった多目的をバランスよく達成する構造ベース創薬手法として提案され、最先端の手法と同等以上の性能を示すとともに、NCI 駆動の分子設計・最適化を通じて結合親和性や特異性の向上を実現するものである。
本論文は、T 細胞受容体と pMHC の結合を解釈可能にするため、エンコーダ - デコーダ型トランスフォーマーのクロスアテンション機構を定量化する新たな手法「QCAI」を提案し、実験的に決定された 274 個の構造データから構築したベンチマーク「TCR-XAI」を用いて、既存手法を上回る解釈性と予測精度を達成したことを示しています。
この論文は、mRNA 設計における多目的最適化問題を解決するため、サンプリングに基づく連続最適化フレームワークを提案し、既存手法よりも安定性や性能に関連する指標を大幅に改善できることを示しています。
モンテカルロシミュレーションを用いた本研究は、タンパク質 YibK において熱的安定性(融解温度)がトポロジー状態に依存しないことを示し、実験と計算の不一致は、深く結びついたタンパク質特有の「ほどける時間」と「展開する時間」の分離により、DSC 実験が非平衡状態を測定していることに起因すると結論付けています。
本論文は、排除体積半径とテザー長の比という単一の無次元パラメータによってナノフィラメント束が反発するか、直感に反して引力で束縛されるか(メタ安定状態)が決まることを示す厳密な解析理論とスケーリング則を確立し、ブラウン動力学シミュレーションによってこのパラドックス的な現象を実証したものである。
モンテカルロシミュレーションを用いた研究により、タンパク質の「ノット(結び目)」構造が展開に対する運動論的安定性を高め、特にノットの深さやアミノ酸配列の複雑さの増加と相関してその効果が顕著になることが示され、これがノットを持つタンパク質の進化における保存要因である可能性が提唱されました。
この論文は、従来の古代 DNA 解析手法が抱える多様な分解状態や混在する由来を無視するバイアスを批判し、断片を基本単位として系統の帰属を保留しつつ確実性を評価する「HSF 事後追跡フレームワーク」を提唱することで、複雑な保存環境下での古代 DNA の信頼性と解析精度を向上させることを主張しています。
本論文は、任意の粗視化マッピングから高精度に全原子構造を再構築できる、深層等変グラフニューラルネットワークと階層アプローチを採用した新しい汎用バックマッピング手法「HEroBM」を提案し、その有効性を G タンパク質共役受容体などの複雑な生体分子系での実証を通じて示したものである。
本レビュー論文は、孤立分子からイオンやタンパク質との複合体に至るまで、原子レベル分子動力学シミュレーションを用いた RNA の動的性質の解明、サンプリング技術や統合的アプローチによる精度向上、そして AI の活用による RNA モデリングの進展について概説しています。
この論文は、実験データと物理的整合性を両立するタンパク質アンサンブル生成を実現するため、拡散モデルの潜在表現を最適化しボルツマン分布に従ってサンプリングする新しい推論時最適化フレームワークを提案し、既存手法の限界を克服するとともに、モデルの過信を招く設計指標の脆弱性も明らかにしたことを述べています。
本研究は、SE(3) 等変換性を備えたフローマッチングに基づく基盤モデル「FLOWR.root」を提案し、3 次元リガンド生成と結合親和性予測を統合的に実行することで、構造依存型の創薬プロセスを包括的に支援するものである。
この論文は、Klf4 の物理的結合エネルギーを測定し、統計力学モデル(線形モデルとイジングモデルの組み合わせ)を用いて解析することで、in vitro の結合エネルギーデータが追加の fitting パラメータなしでヒトゲノム全体における Klf4 の占有パターンを正確に予測できることを実証したものである。
本研究は、分子密度マップの表現学習に特化した多スケールウェーブレット分解に基づく変分オートエンコーダ「Cryo-SWAN」を提案し、3D 形状の再構築精度の向上や拡散モデルとの統合による形状生成など、構造生物学および体積イメージングにおけるデータ駆動型アプローチの新たな基盤を提供しています。