Co-designing sequence and structure of functional de novo enzymes with EnzyGen2

本文介绍了 EnzyGen2,一种基于 7.3 亿参数的蛋白质基础模型,它能够同时共设计序列与结构以生成具有催化活性的高性能全新酶,并在计算基准测试和多种酶家族的实验验证中展现出超越现有最先进方法的性能与效率。

Song, Z., Liu, H., Zhao, Y., Yang, Y., Li, L.

发布于 2026-03-31
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 EnzyGen2 的人工智能系统,它就像一位超级“蛋白质裁缝”,能够根据我们想要的功能,从零开始(De Novo)设计和制造全新的“生物机器”——酶。

为了让你更容易理解,我们可以把蛋白质设计想象成盖房子,把酶想象成具有特殊功能的工具(比如一把能切开特定锁的钥匙,或者一个能处理特定垃圾的粉碎机)。

以下是这篇论文的通俗解读:

1. 以前的难题:先画图纸还是先选砖头?

在 EnzyGen2 出现之前,设计新酶通常分两步走:

  1. 先盖骨架:先设计房子的结构(蛋白质形状),确保它不会塌。
  2. 再选砖头:再决定用什么样的砖块(氨基酸序列)来砌墙,让房子稳固。

问题在于:酶要工作,必须能精准地抓住一个小分子(比如药物或底物),就像钥匙必须完美匹配锁孔。以前的“两步走”方法,往往盖好了房子,却发现钥匙插不进去,或者锁孔形状不对。这就像你盖好了一栋大楼,最后发现门打不开,因为门和锁没对上。

2. EnzyGen2 的绝招:边盖房边配锁

EnzyGen2 是一个7.3 亿参数的超级大脑(基础模型)。它不再把“盖房”和“配锁”分开做,而是同时设计

  • 它的输入
    • 目标锁孔(小分子配体):告诉 AI 我们要抓住什么。
    • 关键零件位置(功能位点):告诉 AI 哪里必须特别坚固。
    • 建筑图纸风格(物种 ID):告诉 AI 我们要模仿哪种生物的风格(比如大肠杆菌的风格),这样造出来的房子才符合自然规律。
  • 它的输出
    • 直接生成一套完美的砖块排列(氨基酸序列)和完美的建筑结构(3D 形状),确保房子盖好后,锁孔正好能插进钥匙。

比喻:以前的方法是先盖个房子,再试着往墙上钻孔装锁,发现不对就拆了重盖。EnzyGen2 则是拿着锁孔的模具,直接一边盖墙一边把锁孔“长”在正确的位置上。

3. 它是怎么学会的?(海量数据训练)

AI 需要大量的“教科书”来学习。以前公开的“蛋白质 - 锁孔”配对数据很少(只有约 2 万对),就像只有 2 万本教科书。

  • EnzyGen2 的壮举:研究团队整理了一个72 万对蛋白质和配体的超级数据库。这相当于给 AI 喂了海量的食谱和对应的成品菜,让它学会了“什么样的食材组合(序列)能做出什么样的菜(结构),并且能完美搭配某种酱汁(配体)”。
  • 多任务学习:它同时学习三件事:猜对缺少的砖块、猜对缺少的结构、猜对能不能抓住锁。

4. 它有多快、多强?

  • 速度快:它生成一个设计只需要极短的时间,比以前的方法快 400 倍。以前可能需要几天,现在几秒钟。
  • 质量好:在电脑模拟测试中,它设计的酶不仅结构稳定,而且能精准抓住目标分子,表现远超之前的顶尖方法(如 RFdiffusion 等)。
  • 实验验证(真金不怕火炼)
    • 团队真的在实验室里造出了三种全新的酶(CAT, AadA, TPMT)。
    • CAT 和 AadA:这些酶能分解抗生素。实验发现,AI 设计的酶不仅能分解抗生素,甚至有的比自然界原本的酶还强!比如,一种 AI 设计的酶能让细菌在极高浓度的抗生素中存活,而野生型酶做不到。
    • TPMT:这种酶用于再生一种重要的生物燃料(SAM)。AI 设计的版本不仅结构像天然的,而且催化效率非常高,甚至发现了一些自然界中从未被充分研究的“新家族”酶。
    • 新颖性:这些新酶和自然界现有的酶,序列相似度只有 50% 左右(就像长得像远房亲戚,但功能一样强),说明 AI 真的创造出了自然界没有的东西。

5. 核心亮点总结

  • 不仅仅是模仿:它不是简单的复制粘贴,而是真正理解了“结构 - 序列 - 功能”之间的深层关系。
  • 引入“物种身份证”:它利用 NCBI 物种分类 ID 作为输入,让 AI 知道要模仿哪种生物的“基因风格”,大大缩小了搜索范围,提高了成功率。
  • 通用性强:它不仅能设计分解抗生素的酶,还能设计用于化工、医药的各种新工具。

一句话总结

EnzyGen2 就像一位拥有上帝视角的“生物建筑师”,它不再盲目试错,而是根据你想要的功能(抓住什么分子),直接为你“打印”出一把全新的、自然界从未有过的、且能完美工作的“生物钥匙”。

这项技术为未来设计绿色化学催化剂、新型药物和环保材料打开了大门,让我们不再局限于自然界现有的工具,而是可以按需定制未来的生物机器。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →