Generative design of sequence specific DNA binding proteins
本論文は、構造生成に RFdiffusion を、オフターゲットスクリーニングに AlphaFold3 を組み合わせた深層学習フレームワークを提示し、これにより従来の手法と比較して成功率が約 100 倍向上する配列特異的 DNA 結合タンパク質の設計に成功した。
原著者:Sehgal, E., Politanska, Y., Mitra, R., Kim, P. T., Gonzalez Rodriguez, N., Warrier, T., Kubaney, A., Morishita, A., Quijano, R., Butcher, J., Krishna, R., Pecoraro, R., Belmont, B., Roullier, N., GoreSehgal, E., Politanska, Y., Mitra, R., Kim, P. T., Gonzalez Rodriguez, N., Warrier, T., Kubaney, A., Morishita, A., Quijano, R., Butcher, J., Krishna, R., Pecoraro, R., Belmont, B., Roullier, N., Goreshnik, I., Vafeados, D. K., Kwon, P., Ramarao, R., Taipale, J., Glasscock, C. J., Baker, D.
原著者: Sehgal, E., Politanska, Y., Mitra, R., Kim, P. T., Gonzalez Rodriguez, N., Warrier, T., Kubaney, A., Morishita, A., Quijano, R., Butcher, J., Krishna, R., Pecoraro, R., Belmont, B., Roullier, N., Goreshnik, I., Vafeados, D. K., Kwon, P., Ramarao, R., Taipale, J., Glasscock, C. J., Baker, D.
提供された抄録に基づき、配列特異的 DNA 結合タンパク質の創出に関する本論文の詳細な技術的概要を以下に示す。
1. 課題
de novo タンパク質設計における近年の著しい進展にもかかわらず、特定の DNA 配列をプログラム的に認識し結合する能力は、この分野における持続的なボトルネックのままだ。一般的なタンパク質のフォールディングや構造予測は改善されたものの、従来の計算手法を用いて、高い特異性と親和性で極めて類似した DNA 配列を区別できるタンパク質を設計することは困難であることが証明されている。
構造生成(RFdiffusion): プロセスは、ターゲット DNA 配列と相互作用するように特別に調整された新規タンパク質のバックボーンと足場を生成するために、拡散ベースの生成モデルであるRFdiffusionを使用することから始まる。これにより、これまでに未開拓であった広大なコンフォメーション空間の探索が可能となる。
明示的スクリーニング(AlphaFold3): 特異性の課題に対処するため、生成された設計は、AlphaFold3を用いた重要なフィルタリング段階を経る。より単純なエネルギー関数に依存する可能性のある従来手法とは異なり、AlphaFold3 はオフターゲット相互作用を明示的に予測・スクリーニングするために利用される。これにより、設計されたタンパク質がターゲット DNA に結合できるだけでなく、非ターゲット配列への結合可能性も低いことが保証される。
3. 主要な貢献
生成 AI と構造予測の統合: 本論文は、RFdiffusion の生成能力と AlphaFold3 の高精度な相互作用モデリングを結合した統合フレームワークを導入する。
ハイスループット設計戦略: 著者らは、15 の多様な DNA ターゲットそれぞれに対して大規模な候補ライブラリ(96 設計)を生成することで、概念実証的な単一ターゲット設計を超えたスケーラブルなアプローチを実証する。