Learning the structural diversity in random protein sequence space

通过利用高通量 FRET 生物传感器和机器学习对一百万种合成随机蛋白质进行筛选,该研究揭示出类生物的紧凑蛋白质折叠结构在随机序列空间中竟可及且可学习,从而挑战了功能结构是罕见奇异点的观点。

原作者: Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

发布于 2026-05-05
📖 1 分钟阅读☕ 轻松阅读

原作者: Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象所有可能的蛋白质构成的宇宙,就像一座庞大而无限的图书馆。目前,地球上的生命只阅读了这座图书馆中极小极小的一部分书籍。科学家们一直在思索:那些“好”书——即能够折叠成有用且稳定结构的蛋白质——是深藏于书架深处的稀有孤本,还是实际上很常见,只要随机翻阅书页就能轻易找到?

为了回答这个问题,研究人员决定停止猜测,开始阅读。他们编写并测试了一百万条自然界从未见过的全新随机“故事”(蛋白质序列)。他们在活细胞内利用一种巧妙的超高速成像系统(FRET 生物传感器),观察这些随机蛋白质的行为。

以下是他们在这座充满随机创意的图书馆中发现的情况:

  • 混乱:许多随机蛋白质就像一团无法自行打结的乱麻(无序链),或者聚集成黏糊糊、有害的团块,使细胞不堪重负(聚集体)。
  • 惊喜:然而,他们也发现数量惊人的“良性”蛋白质。这些蛋白质既不杂乱也不黏连;它们整齐地折叠成紧凑的球状结构,看起来与自然界中观察到的蛋白质非常相似。关键的是,细胞的“安保人员”(分子伴侣)甚至没有注意到它们,也没有试图修复它们,因为它们表现得如此规整。

这就像将一百万把随机抓取的乐高积木抛向空中。你可能会预期它们落地时会是一团混乱。相反,研究人员发现,其中有相当数量的积木自动落成了完美且稳定的城堡形状,无需任何大师级建造者的干预。

最后,该团队教会了一台计算机(机器学习)识别使这些随机蛋白质良好折叠的模式。一旦计算机从这些随机实验中学习了规则,它就能成功预测自然界中蛋白质的结构。

核心结论
这项研究表明,“类生物”结构并非罕见、神奇的偶然产物。它们实际上相当普遍且易于获取,即使是在随机序列的海洋中也是如此。这为科学家提供了一张新地图,使他们能够设计全新的蛋白质,不仅复制进化已经完成的工作,还能探索物理上可能实现的广阔未charted领域。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →