原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明
Each language version is independently generated for its own context, not a direct translation.
想象一下,你正在尝试烘焙一块完美的饼干。你有一份食谱(即蛋白质),但你想稍微调整一下配料——也许多加一撮糖、换一种面粉,或者添加一种新香料——让它味道更佳。这就是科学家所称的“蛋白质设计”。
长期以来,科学家们主要依靠两种方法来推测哪些配料调整会奏效:
- 传统厨师(常规基线方法):这些方法基于那些已经过测试并被证明有效的食谱。它们依赖简单的规则,并将你的新构想与旧有的、熟悉的方案进行比较。
- AI 超级厨师(蛋白质语言模型或 pLMs):这些是庞大的复杂计算机程序,在数百万份蛋白质“食谱”上进行了训练。它们本应理解生命深层且隐藏的语法,并预测哪些新组合无需品尝就能带来美味。
重大测试
本文的研究人员决定对这两组进行考验。他们设计了一个“饼干挑战”,在其中他们不仅改变了一种配料,而是同时改变了多种配料,从而创造出成千上万种狂野而复杂的变体(突变景观)。随后,他们评估了 AI 厨师和传统厨师在预测这些疯狂的新饼干中哪些实际上味道好(具有功能)、哪些会烤焦(无功能)方面的表现。
令人惊讶的结果
研究发现了一个相当出乎意料的现象:AI 超级厨师并未获胜。
- 所有 AI 模型表现一致:无论 AI 模型规模多大、设计多么精巧,它们彼此之间的表现大致相同。
- AI 未超越基础方法:复杂的 AI 模型在统计上并不优于简单、传统的基线方法。事实上,传统方法在预测哪些变体有效方面同样出色。
- “零样本”局限性:即使 AI 尝试在不进行任何额外训练的情况下自行预测(零样本),它也无法做得比仅仅比较新食谱与已知旧食谱的相似度更好。
核心启示
作者指出,这些 AI 模型就像那些背熟了字典却未学会烹饪的学生。它们知道单词(蛋白质中的字母序列),但可能缺失了厨房的“物理学”——即配料如何实际相互作用、折叠并粘合在一起。
为了真正助力设计更优的蛋白质,本文建议这些 AI 模型可能需要学习物理规则和结构知识,或者需要与能够理解蛋白质三维形状的工具相结合,而不能仅依赖食谱文本本身。
您所在领域的论文太多了?
获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。