Connecting polygenic disease risk to cell states and regulatory programs through single-cell chromatin accessibility

本文提出了一种名为 SCADS 的计算框架,通过整合单细胞染色质可及性数据(scATAC-seq)与全基因组关联研究(GWAS)汇总统计数据,能够精准识别并量化不同细胞状态中的多基因疾病风险,从而揭示疾病相关的细胞群体及其背后的调控程序。

原作者: Yu, L., Deary, L. T., Liu, Q., Zhang, Q., Zhao, S.

发布于 2026-04-28
📖 1 分钟阅读☕ 轻松阅读

原作者: Yu, L., Deary, L. T., Liu, Q., Zhang, Q., Zhao, S.

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

寻找疾病的细胞踪迹:如何将遗传风险与细胞状态联系起来

在人体内,成千上万种不同的细胞共同维持着生命。虽然这些细胞都拥有相同的遗传蓝图,但它们的工作方式截然不同。这种差异源于细胞如何读取其基因组。在某些细胞中,特定的基因区域是开放的,允许细胞读取并执行指令;而在另一些细胞中,这些区域则是关闭的。

科学家们通过大规模的研究发现,许多疾病与人体内非编码区域的遗传变异有关。这些变异并不直接改变蛋白质本身,而是改变了基因组中那些负责“开关”基因的调控区域。虽然研究人员知道这些变异点与疾病相关,但由于这些变异分布在全身各处的细胞中,很难确定究竟是哪种类型的细胞在疾病发生过程中扮演了关键角色。

为了解决这个问题,研究人员开发了一种名为 SCADS 的计算框架。该框架旨在将大规模的遗传关联研究数据与单细胞染色质可及性数据结合起来,从而识别出与疾病最相关的细胞群体。

SCADS 的工作流程分为三个步骤。首先,它利用一种主题模型技术来识别染色质中的协同调控区域。这些区域在功能上是相互关联的,通常共同控制一组特定的基因程序。其次,研究人员计算这些调控区域中包含了多少与疾病相关的遗传变异信号。最后,通过结合每个细胞中这些调控区域的活跃程度及其携带的疾病信号强度,SCADS 为每个细胞计算出一个经过校准的疾病得分。这种得分方式使得不同数据集和不同疾病之间的比较成为可能。

在模拟实验中,SCADS 在保持低错误率的同时,比现有的方法具有更高的检测效能。

研究人员将这一方法应用于多种自身免疫性疾病的研究中。结果显示,即使是在同一种免疫细胞类型内部,不同细胞状态对疾病的影响也存在显著差异。例如,在研究炎症性肠病时,SCADS 揭示了 CD8+ T 细胞和结肠上皮细胞内部存在明显的异质性。研究人员不仅识别出了这些细胞中与疾病高度相关的特定亚群,还进一步找出了驱动这些细胞表现出疾病特征的基因程序和具体的遗传变异。

SCADS 具有可扩展性、可解释性和模块化的特点。它提供了一个通用的框架,用于将非编码区的调控变异与细胞的身份及功能联系起来。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →