New genetic codes in bacteria and archaea identified with a fast k-mer based algorithm

该研究提出了一种比现有方法快 100 多倍的基于 k-mer 的快速算法,用于从组装基因组中推断遗传密码,并成功应用于数千个细菌和古菌样本,从而发现了新的遗传密码变体,包括首个古菌密码子重新分配案例。

原作者: Melnykov, A. V.

发布于 2026-04-06
📖 1 分钟阅读☕ 轻松阅读
⚕️

这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一项关于生命“翻译规则”的新发现,以及一种能超快速找到这些规则的新方法。

为了让你更容易理解,我们可以把整个故事想象成在破解外星人的密码本

1. 背景:生命的通用密码本(但偶尔会出错)

想象一下,地球上所有的生物(细菌、人类、植物)都共用同一本**“生命密码本”**(遗传密码)。

  • 密码本的作用:它告诉细胞如何把 DNA 里的字母(A, T, C, G)翻译成建造身体的零件(蛋白质)。
  • 通常情况:这本密码本几乎是通用的。比如,代码"AAA"通常都代表一种叫“赖氨酸”的零件。
  • 特殊情况:就像不同国家的人对同一个词可能有不同的方言一样,有些细菌或古菌(一种古老的微生物)会偷偷修改这本密码本。比如,它们可能把"AAA"不再翻译成“赖氨酸”,而是翻译成“谷氨酸”。

过去,科学家发现这些“方言”主要靠人工慢慢检查,或者用一种叫 Codetta 的超级电脑程序。但 Codetta 有个大缺点:它太慢了,就像用算盘去算宇宙飞船的轨道,处理几千个新发现的微生物基因组需要耗费巨大的算力,普通科学家根本用不起。

2. 新工具:KACI(生命的“速查字典”)

作者 Artem Melnykov 发明了一个新算法,叫 KACI

  • 旧方法(Codetta)的比喻:就像你要翻译一句话,必须把每个单词都拿出来,去查一本厚厚的字典,还要对比上下文,非常耗时。
  • 新方法(KACI)的比喻:KACI 不再逐字查字典,而是背熟了一堆“常用短语”
    • 它手里有一本**“超级速查表”,里面记录了成千上万个蛋白质家族中最稳定的“短词组”**(比如“红 - 绿-蓝”这种固定搭配)。
    • 当它看到一段新的 DNA 时,它不需要从头分析,而是直接拿着这段 DNA 里的“短词组”去速查表里**“对号入座”**。
    • 效果:这就像从“逐字翻译”变成了“看成语猜意思”,速度提升了 144 倍!以前需要超级计算机集群跑几天的任务,现在普通人的笔记本电脑几个小时就能搞定。

3. 新发现:找到了三个新的“方言”

作者用这个新工具扫描了 270 万 个细菌和古菌的基因组,发现了一些以前没注意到的“密码本修改”:

发现一:细菌里的"ACA"变身记

  • 原本:在大多数生物里,密码 ACA 代表“苏氨酸”(一种零件)。
  • 新发现:在某些生活在土壤和矿坑排水里的细菌中,ACA 竟然被改成了代表“天冬氨酸”。
  • 证据:这些细菌的“翻译员”(tRNA)长得和普通的苏氨酸翻译员不一样,就像你发现一个说英语的人突然用英语语法讲中文,而且他的发音器官(tRNA)结构也变了。

发现二:细菌里的"CGG"变脸

  • 原本CGG 通常代表“精氨酸”。
  • 新发现:在人类肠道和猪圈样本里的某些细菌中,CGG 被改成了代表“丙氨酸”。
  • 证据:这些细菌的“翻译员”身上少了一个原本该有的“身份证”(精氨酸特征),却多了一个丙氨酸的特征。

发现三:古菌界的“大新闻”(最重要!)

  • 原本:古菌(一种比细菌更古老的微生物)通常严格遵守通用密码。
  • 新发现:作者在海底热泉口的古菌样本中,发现 CGG 竟然被改成了代表“色氨酸”!
  • 意义:这是人类第一次在古菌的“核心密码”(非停止密码)中发现这种修改。这就像发现了一个从未被记录过的“外星语言”变体。
  • 疑点:这些古菌似乎还完全“消灭”了另一个密码 CGA(可能把它变成了“停止信号”),这让它们变得非常独特。

4. 为什么这很重要?

  1. 进化之谜:了解这些“方言”怎么来的,能帮我们解开生命进化史上最难的谜题之一:为什么大家一开始都共用一本密码本,后来又有谁改了,又是怎么改的?
  2. 数据库更准:以前因为不知道这些细菌改了密码,科学家在分析它们的基因时,会把蛋白质翻译错(就像把“苹果”翻译成“香蕉”)。现在有了 KACI,我们可以自动修正这些错误,让基因数据库更准确。
  3. 未来潜力:以前因为算得太慢,很多新发现的微生物被忽略了。现在有了这个“加速器”,我们可以快速扫描成千上万的新物种,说不定还能发现更多神奇的“生命方言”。

总结

这就好比科学家以前是用放大镜在茫茫书海里找错别字,累得半死还找不全。现在,Artem Melnykov 发明了一台**“智能扫描仪”,不仅能瞬间扫完所有书,还意外地在几本不起眼的旧书里,发现了三个从未被记录的“秘密方言”**。这不仅证明了扫描仪的厉害,也让我们对生命多样性的理解又深了一步。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →