Domain classification of archaeal proteomes reveals conserved fold repertoire

该研究通过对 65 个古菌类群中超过 12 万种蛋白质的系统分类分析发现,古菌在单结构域层面的折叠 repertoire 与已知生命形式高度保守,其结构新颖性被低估主要归因于序列分歧导致的分类敏感性不足,而非存在大量未知的新型结构。

Schaeffer, R. D., Pei, J., Guo, R., Zhang, J., Medvedev, K., Cong, Q., Grishin, N.

发布于 2026-04-06
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是一次对**古菌(Archaea)**这个神秘生物界的“人口普查”和“建筑大搜查”。

为了让你更容易理解,我们可以把蛋白质想象成乐高积木,把蛋白质的结构(Fold)想象成积木的拼法(比如怎么拼出一辆车、一座塔)

1. 背景:为什么我们要去查古菌?

地球上的生命分三大类:细菌、真核生物(包括人类、动物、植物)和古菌

  • 现状: 科学家已经拼好了很多细菌和人类的“乐高模型”,并建立了详细的“拼法说明书”(数据库)。
  • 问题: 古菌虽然也是生命的一大类,生活在极端环境(如深海热泉、盐湖)甚至人体肠道里,但科学家手里只有它们很少的“模型”。这就好比我们只见过很少的古菌“乐高”,不知道它们是不是藏着什么全世界独一无二的、从未见过的全新拼法
  • 猜想: 也许古菌因为生活环境太特殊,进化出了很多我们从未见过的“神奇拼法”?

2. 这次研究做了什么?

研究人员利用最新的AI 预测技术(AlphaFold3),像变魔术一样,把12 万多个古菌蛋白质的结构都“算”了出来。然后,他们把这些算出来的结构,拿去和现有的“拼法说明书”(ECOD 数据库)进行比对。

这就好比:

  • 以前我们只有几千块古菌积木。
  • 现在 AI 帮我们“猜”出了 12 万块古菌积木的样子。
  • 然后,我们拿着这 12 万块积木,去和现有的说明书对对看,看看它们是不是能对应上。

3. 发现了什么?(核心结论)

结论一:并没有那么多“新发明”
大家原本以为,古菌可能会藏着很多“外星级”的全新拼法。但结果让人惊讶:绝大多数古菌的积木,用的都是我们熟悉的拼法!

  • 大约 80% 的古菌蛋白质,都能直接找到对应的“说明书”,它们用的拼法和细菌、人类用的几乎一样。
  • 这说明,生命在最基础的“积木拼法”层面上,是高度通用的。不管是细菌、人类还是古菌,大家用的都是同一套“乐高基础件”。

结论二:为什么以前觉得它们很神秘?
既然拼法都一样,为什么以前觉得古菌很神秘,甚至有很多“无法分类”的蛋白质呢?

  • 原因 1:说明书不够全(分类灵敏度问题)。 古菌的积木形状有点“变形”或“走样”了(序列差异大),就像乐高积木被稍微压扁了一点。以前的比对工具太死板,认不出这些变形的积木,就以为它们是“新发明”。
  • 原因 2:AI 预测有时候会“手抖”(预测质量)。 有些古菌蛋白质太短,或者结构太乱(像一团乱麻),AI 算出来的样子不太准。这些“算不准”的积木,自然也就没法和说明书对上号。
  • 真相: 那些“无法分类”的蛋白质,大部分不是真的有新拼法,而是因为太像了但没认出来,或者算得不够准

结论三:真正的“新发明”极少
研究人员像侦探一样,把那些“算不准”和“认不出”的蛋白质层层过滤(去掉太短的、去掉算不准的、去掉乱麻状的)。最后发现,真正可能拥有全新、从未见过拼法的蛋白质,少得可怜,甚至不到总数的 0.1%

4. 几个有趣的发现(比喻版)

  • 古菌的“通用性”: 就像不管是在北极还是热带,大家用的“杯子”形状都差不多(都是圆柱体加把手)。古菌虽然生活在极端环境,但它们造蛋白质的“模具”和细菌、人类是一样的。
  • MVP 蛋白(主 vault 蛋白): 以前有科学家发现古菌里有一种蛋白很像人类的“金库蛋白”(Vault),觉得这是古菌和人类最近的亲戚证据。但这次大规模调查发现,这种蛋白其实所有古菌都有,不仅仅是那个特殊的“阿斯加德古菌”(Asgard)才有。这说明这种“金库”结构在生命演化早期就存在了,而不是后来才发明的。
  • MCR 蛋白(产甲烷酶): 这种蛋白只在产甲烷的古菌里有,细菌和人类都没有。这就像是一种“特制工具”,专门用来在极端环境下干活,是古菌的“独门绝技”,但这属于功能上的特化,而不是拼法上的创新

5. 总结:这对我们意味着什么?

这篇论文告诉我们:

  1. 生命的基础很统一: 无论生命形式多么千奇百怪,它们构建身体的“基本积木拼法”是共通的。
  2. 以前的“未知”其实是“没认出来”: 我们之前觉得古菌有很多未知结构,其实是因为我们的“识别工具”不够灵敏,没能认出那些长得有点变形的老面孔。
  3. 未来的方向: 科学家不需要再去疯狂寻找“全新的拼法”了(因为可能真的很少)。未来的重点应该是:
    • 改进“识别工具”,把那些长得像但没认出来的古菌蛋白给认出来。
    • 研究这些通用积木是如何排列组合成不同功能的(就像同样的乐高积木,能拼出车也能拼出飞机)。
    • 去病毒的世界里找找看,那里可能才藏着真正的“外星拼法”。

一句话总结:
古菌并没有我们想象中那么“外星”,它们用的也是地球生命通用的“乐高积木”;以前觉得它们神秘,只是因为我们还没学会怎么认出那些“变形”的积木而已。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →