Phylogenetically estimated neutral rates and fitness effects of mutations to influenza proteins

本研究通过基于超过 10 万条流感序列构建系统发育树,估算了病毒蛋白质组中位点特异性的中性突变率与适应度效应,揭示了突变类型间的显著差异、与 SARS-CoV-2 和 HIV 之间强烈的跨病毒相关性,并提供了一个全面且可交互的资源,以阐明突变与选择如何在自然界中塑造流感的进化。

原作者: Haddox, H. K., Hinrichs, A. S., Jennings-Shaffer, C., Johnson, K., Benton, C. T., Galloway, J. G., Bloom, J. D., Matsen, F. A.

发布于 2026-05-20
📖 1 分钟阅读☕ 轻松阅读

原作者: Haddox, H. K., Hinrichs, A. S., Jennings-Shaffer, C., Johnson, K., Benton, C. T., Galloway, J. G., Bloom, J. D., Matsen, F. A.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象流感病毒是一座庞大而混乱的图书馆,其中的书籍(其遗传密码)正被不断复制和重写。有时,这些重写只是随机的小错别字,完全不影响故事内容(中性突变);而另一些时候,错别字要么糟糕到毁掉整个情节,要么好到让故事成为畅销书(影响适应度的突变)。

长期以来,科学家只能同时观察几千本这样的书籍,以理解这座图书馆如何演变。这项新研究则如同雇佣了一支超高速机器人舰队,一次性阅读并整理超过 10 万本这样的病毒书籍。通过从这一海量数据构建出一棵巨大的家系树,研究人员终于得以窥见全局。

以下是他们发现的要点,以简明概念呈现:

1. “错别字”机器并非随机
你可能会认为,当病毒犯错时,它用任何字母替换任何其他字母的概率都是相等的(例如,将"A"替换为"C"的概率与将"A"替换为"G"的概率相同)。但研究发现事实并非如此。病毒在犯错时具有非常具体的“偏好”。某些类型的错别字发生的频率比其他类型高出 100 倍。这就像病毒的复印机卡住了,使其更倾向于产生某些特定的错误。

2. 与其他病毒的家族相似性
当研究人员将这些“错别字模式”与其他著名病毒(如 SARS-CoV-2 和 HIV)进行比较时,他们发现了一种令人惊讶的家族相似性。这些病毒犯错的基本规则非常相似,就像拥有相同家族鼻子的表亲。然而,当你更仔细地观察具体细节(例如错别字周围字母的上下文)时,流感病毒和 SARS-CoV-2 又显得截然不同,就像在不同街区长大的表亲。

3. “适应度”记分卡
研究人员想知道:这些错别字中,究竟哪些真正重要?为此,他们玩了一场“预期与现实”的游戏:

  • 预期:基于他们发现的“错别字机器”偏好,他们计算出,如果某个特定突变完全无关紧要,它本应出现多少次。
  • 现实:他们统计了该突变在家系树中实际出现了多少次。
  • 结果:如果某个突变出现的频率远低于预期,就意味着病毒“拒绝”了它,因为它有害(适应度差);如果其出现频率符合预期,则它很可能是无害的。

他们创建了一张巨大的记分卡,涵盖了流感病毒每种蛋白质中约 33,000 种听起来有害的变异和 8,000 种听起来无害的变异。

4. 隐藏规则与互动地图
这张记分卡揭示了一些意外发现。例如,即使是那些本应“无害”的同义突变,有时出现的频率也低于预期,这表明它们实际上具有我们尚未知晓的隐藏规则或功能。

为了让如此庞大的数据易于探索,研究团队构建了交互式热力图(如同色彩丰富、可点击的地图)。你可以点击病毒代码的任何部分,查看其“适应度评分”,从而帮助我们确切了解病毒的哪些部分脆弱,哪些部分灵活。

简而言之
这项研究并非只翻阅了流感病毒故事的几页,而是阅读了整个图书馆。通过将病毒自然的“错误”与我们预期中随机发生的情况进行对比,他们绘制了一幅详尽的地图,展示了突变和选择在现实世界中如何塑造流感病毒,同时也揭示了它如何融入包括 SARS-CoV-2 和 HIV 在内的更广泛的病毒家族。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →