Learning the structural diversity in random protein sequence space

原作者： Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

发布于 2026-05-05

📖 1 分钟阅读☕ 轻松阅读

原作者： Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

原始论文采用 CC BY 4.0 许可（https://creativecommons.org/licenses/by/4.0/）。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。阅读完整免责声明

想象所有可能的蛋白质构成的宇宙，就像一座庞大而无限的图书馆。目前，地球上的生命只阅读了这座图书馆中极小极小的一部分书籍。科学家们一直在思索：那些“好”书——即能够折叠成有用且稳定结构的蛋白质——是深藏于书架深处的稀有孤本，还是实际上很常见，只要随机翻阅书页就能轻易找到？

为了回答这个问题，研究人员决定停止猜测，开始阅读。他们编写并测试了一百万条自然界从未见过的全新随机“故事”（蛋白质序列）。他们在活细胞内利用一种巧妙的超高速成像系统（FRET 生物传感器），观察这些随机蛋白质的行为。

以下是他们在这座充满随机创意的图书馆中发现的情况：

混乱：许多随机蛋白质就像一团无法自行打结的乱麻（无序链），或者聚集成黏糊糊、有害的团块，使细胞不堪重负（聚集体）。
惊喜：然而，他们也发现数量惊人的“良性”蛋白质。这些蛋白质既不杂乱也不黏连；它们整齐地折叠成紧凑的球状结构，看起来与自然界中观察到的蛋白质非常相似。关键的是，细胞的“安保人员”（分子伴侣）甚至没有注意到它们，也没有试图修复它们，因为它们表现得如此规整。

这就像将一百万把随机抓取的乐高积木抛向空中。你可能会预期它们落地时会是一团混乱。相反，研究人员发现，其中有相当数量的积木自动落成了完美且稳定的城堡形状，无需任何大师级建造者的干预。

最后，该团队教会了一台计算机（机器学习）识别使这些随机蛋白质良好折叠的模式。一旦计算机从这些随机实验中学习了规则，它就能成功预测自然界中蛋白质的结构。

核心结论：
这项研究表明，“类生物”结构并非罕见、神奇的偶然产物。它们实际上相当普遍且易于获取，即使是在随机序列的海洋中也是如此。这为科学家提供了一张新地图，使他们能够设计全新的蛋白质，不仅复制进化已经完成的工作，还能探索物理上可能实现的广阔未charted领域。

类似论文