PolyGenie: a reproducible Nextflow pipeline for phenome-wide association studies using polygenic risk scores
本文介绍了 PolyGenie,这是一个开源的 Nextflow 流程,旨在通过整合预先计算的遗传风险评分与表型数据,在任意队列中实现可扩展、可复现的表型全基因组关联分析(PheWAS),并提供交互式可视化功能。
511 篇论文
基因组学探索着生命最底层的密码,致力于解读决定生物性状的遗传蓝图。这一领域不再局限于实验室,而是正深刻影响着我们对疾病、进化乃至人类自身起源的理解。在 Gist.Science 的基因组学版块中,我们专注于呈现来自 bioRxiv 的最新预印本,确保您能第一时间接触到科学界最前沿的未经同行评审的原始发现。
我们的团队会即时处理 bioRxiv 发布的每一篇相关预印本,将其转化为通俗易懂的科普摘要与详尽的技术解读,帮助不同背景的读者跨越专业壁垒。无论您是寻求灵感的科研工作者,还是对生命奥秘充满好奇的探索者,这里都能为您提供清晰、及时的资讯。
以下是该领域最新发布的论文列表,邀请您一同开启这场解读生命密码的探索之旅。
本文介绍了 PolyGenie,这是一个开源的 Nextflow 流程,旨在通过整合预先计算的遗传风险评分与表型数据,在任意队列中实现可扩展、可复现的表型全基因组关联分析(PheWAS),并提供交互式可视化功能。
本研究报道了具有显著生防潜力的有益真菌 Trichoderma gamsii 菌株 T035 的高质量基因组序列,填补了该物种基因组资源的空白,将为解析其生物防治分子机制及开发可持续植物保护策略提供关键支持。
本研究利用多平台测序技术,首次完成了来自布基纳法索的冈比亚按蚊共生微孢子虫(Microsporidia sp. MB)的端粒到端粒完整基因组组装,揭示了其 9.16Mb 的基因组结构、独特的端粒重复序列特征及潜在的疟疾抑制机制,为利用该共生体进行疟疾防控提供了重要的基因组学基础。
该研究提出了名为 ChIANet 的多模态深度学习框架,能够仅基于蛋白质结合谱预测跨不同功能背景下的蛋白质介导染色质三维架构,揭示了 CTCF、Cohesin 和 RNAPII 在维持稳定结构与响应转录调控中的不同作用机制,并成功应用于解析癌症中 ecDNA 区域的染色质互作网络。
本研究通过染色体特异性 DNA 提取和新型生物信息学工具 rDNAmine,利用酵母 rDNA 作为基准,成功验证了一种无需全局比对即可从长读长测序数据中高效分析长重复序列多态性的新方法。
该研究针对锥虫类寄生虫独特的基因共转录机制,开发了基于短读长 RNA 测序数据的实用可扩展工具,用于精准注释剪接受体位点、多聚腺苷酸化位点及非翻译区,并据此完成了对所有可用锥虫基因组中非翻译区的全面注释。
该研究提出了一种基于柯西 p 值聚合的稳健基因 - 环境(GxE)交互作用检测方法,通过整合加性、显性和隐性遗传模型的检验结果,显著提升了在不同遗传模型(尤其是隐性模型)下的统计功效,并在 UK Biobank 数据分析中发现了远超传统方法的 GxE 位点。
该研究通过全基因组分析揭示了人类中存在大量受进化保守且组织特异性调控的双编码区域(DCRs),表明其作为可变剪接的常见产物,主要通过引入无序肽段或截短蛋白来微调基因调控程序并增加功能多样性。
该研究利用高分辨率 Micro-C 技术揭示了乳腺癌进展过程中基因组结构从早期的大规模区室重组到晚期精细的拓扑结构域与染色质环变化的动态演变,并证实这些结构重塑通过改变增强子 - 启动子互作及表观遗传修饰,在功能上驱动了癌症相关基因的表达重编程。
本文介绍了 Lorax,这是一个基于 GPU 加速的 Web 原生平台,旨在通过整合基因组位置、共祖时间及元数据等关键信息,实现对生物库规模祖先重组图谱(ARG)的实时交互式可视化探索。