Generative design of sequence specific DNA binding proteins

本文提出了一种深度学习框架,该框架结合 RFdiffusion 进行结构生成,并利用 AlphaFold3 进行脱靶筛选,成功设计了序列特异性 DNA 结合蛋白,其成功率较以往方法提高了约 100 倍。

原作者: Sehgal, E., Politanska, Y., Mitra, R., Kim, P. T., Gonzalez Rodriguez, N., Warrier, T., Kubaney, A., Morishita, A., Quijano, R., Butcher, J., Krishna, R., Pecoraro, R., Belmont, B., Roullier, N., Gore
发布于 2026-04-27
📖 1 分钟阅读☕ 轻松阅读

原作者: Sehgal, E., Politanska, Y., Mitra, R., Kim, P. T., Gonzalez Rodriguez, N., Warrier, T., Kubaney, A., Morishita, A., Quijano, R., Butcher, J., Krishna, R., Pecoraro, R., Belmont, B., Roullier, N., Goreshnik, I., Vafeados, D. K., Kwon, P., Ramarao, R., Taipale, J., Glasscock, C. J., Baker, D.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象一下,你正试图从一把包含数百万个外观相似锁具的巨大钥匙串中,打造一把仅能开启其中一把特定锁的定制钥匙。长期以来,科学家们擅长设计“钥匙”(蛋白质)本身,却难以确保这些钥匙仅开启其预定目标,而不会意外卡住错误的锁。这正是制造能够识别并结合特定 DNA 序列的蛋白质所面临的挑战。

本文介绍了一种新型高科技“设计师”,通过两步流程解决了这一问题:

  1. 架构师(RFdiffusion):首先,团队利用名为 RFdiffusion 的强大人工智能工具,从头绘制全新蛋白质结构的蓝图。这好比一种生成式艺术工具,能够瞬间从零开始绘制成千上万种独特的钥匙设计,而非试图修改旧有设计。
  2. 安保员(AlphaFold3):蓝图绘制完成后,他们并非直接制造钥匙,而是使用另一种人工智能 AlphaFold3 对它们进行严格的安保检查。这位“安保员”模拟钥匙尝试插入成千上万个“错误”锁具的过程,以确保其不会粘附于任何不该粘附的对象。它会过滤掉任何可能导致混淆的设计。

结果
团队通过将该方法应用于 15 种不同的 DNA 靶标来测试其效果。针对每个靶标,他们生成了 96 种不同设计。结果如何?他们成功为 15 个靶标中的 7 个找到了具有功能且高度特异性的结合蛋白。

为便于理解,以往的方法好比在干草堆中随机猜测寻找针,成功率极低。而这一新方法被描述为在寻找正确匹配方面比此前任何方法高出约100 倍

双重核查工作
为确保这些新“钥匙”真正精确,研究人员并未止步于计算机模拟。他们在实验室中通过“变体竞争实验”(想象一场竞赛:正确的钥匙与略有差异的错误钥匙竞争,看哪一把胜出)和“随机化文库筛选”(将大量潜在钥匙混合投掷到锁具前,观察哪些能粘附)进行了测试。这些实验证实,新蛋白质能够清晰区分其目标与外观相似的 DNA,展现出稳健性和准确性。

简言之,本文展示了在教导计算机设计可高精度识别并结合特定 DNA 序列的定制蛋白质方面的重大飞跃,最终解决了该领域长期存在的一个障碍。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →