Building an Interoperable Rare Disease Multi-omic Resource: The GREGoR Data Model and Dataset

GREGoR 联盟开发了一种模块化、可互操作的数据模型,以标准化来自不同临床站点的大量组学和表型数据,成功整合了来自超过 12,000 名参与者的信息,从而推动大规模罕见病研究和跨研究分析。

原作者: Heavner, B. D., Wheeler, M. M., Bengtsson, J. D., Carvalho, C. M. B., Cheung, W. A., Conomos, M. P., Delot, E. C., DiTroia, S., Ganesh, V. S., Gogarten, S. M., Grochowski, C. M., Jhangiani, S. N., Kin
发布于 2026-05-19
📖 1 分钟阅读☕ 轻松阅读

原作者: Heavner, B. D., Wheeler, M. M., Bengtsson, J. D., Carvalho, C. M. B., Cheung, W. A., Conomos, M. P., Delot, E. C., DiTroia, S., Ganesh, V. S., Gogarten, S. M., Grochowski, C. M., Jhangiani, S. N., King, C. H., LeMaster, C., Marvin, C. T., Marwaha, S., Miller, D. E., O'Donnell-Luria, A., Pais, L., Patterson, K., Qi, G., Richardson, M., Smail, C., Stilp, A. M., Tong, C. C., Ungar, R. A., Weisburd, B., Bamshad, M. J., Bernstein, J. A., Eichler, E. E., Gibbs, R. A., Lupski, J. R., May, S. J., Montgomery, S. B., Pastinen, T., Posey, J., Rehm, H. L., Shojaie, A., Talkowski, M. E., Vilain, E., Wei, C

原始论文采用 CC BY 4.0 许可(https://creativecommons.org/licenses/by/4.0/)。 ⚕️ 这是一篇未经同行评审的预印本的AI生成解释。这不是医疗建议。请勿根据此内容做出健康决定。 阅读完整免责声明

想象一下,试图拼凑一个巨大的全球性拼图,其中每一块都来自不同的工厂。有些块是方形的,有些是三角形的,而且它们都用不同的语言“说话”。这正是研究人员在研究罕见疾病时所面临的困境。他们拥有来自全球各地医院和实验室的遗传线索和患者故事,但由于每个人记录信息的方式各不相同,这些拼图块无法拼接在一起。你无法轻松地将一位患者的故事与另一位患者的故事进行比较,这使得寻找解开这些疾病谜团所需模式变得困难。

为了解决这一问题,一个名为GREGoR 联盟的团体决定制定一份通用的“操作手册”,用于规范如何记录这些信息。可以将这份手册想象为一套标准化的乐高积木。此前,每位科学家都在使用仅适用于其自身作品的定制积木;而现在,他们都使用同一套具有相同连接件的积木。

以下是他们的新系统——GREGoR 数据模型——在日常语境中的运作方式:

  • 模块化设计:想象一个可以方便地更换抽屉的文件柜。该系统正是如此构建的。它允许研究人员插入不同类型的“组学”数据(即生物信息的不同层次,例如 DNA、蛋白质或细胞功能),同时仍将所有内容整齐地归入同一位患者的档案之下。
  • “谁做的”标签:该系统的一个关键功能类似于食谱上的标签。如果科学家使用某种特定的高科技设备发现了一条遗传线索,系统便会为该线索打上标签,注明具体是由哪台设备发现的。这确保了即使技术日后发生变化,我们仍能确切知晓原始发现的来源。
  • 连接点滴:由于所有人现在都在使用相同的“乐高积木”,研究人员得以将来自12,292 名个体、涵盖5,029 个家庭的数据拼接在一起。这形成了一个单一、庞大且协调一致的数据集,可直接用于分析,而非一堆杂乱无章、互不兼容的文件。

该论文声称,通过采用这种灵活且协作的“操作手册”,联盟已成功创建了一个巨大的共享资源。他们正在公开共享这些数据,其他从事罕见疾病研究的团体也开始使用同一份手册。其结果是,不同的研究团队终于能够相互沟通并整合各自的发现,从而使解决罕见疾病的工作变得更加迅速和高效。

您所在领域的论文太多了?

获取与您研究关键词匹配的最新论文每日摘要——附技术摘要,使用您的语言。

试用 Digest →