LongcallD: joint calling and phasing of small, structural and mosaic variants from long reads
本文介绍了 LongcallD,这是一个利用长读长测序数据的局部多重序列比对,能够同时、统一地检测并定相小变异、结构变异及低比例嵌合变异的计算框架,从而显著提升了变异发现的准确性并解决了现有工具将这些问题割裂处理的局限。
509 篇论文
基因组学探索着生命最底层的密码,致力于解读决定生物性状的遗传蓝图。这一领域不再局限于实验室,而是正深刻影响着我们对疾病、进化乃至人类自身起源的理解。在 Gist.Science 的基因组学版块中,我们专注于呈现来自 bioRxiv 的最新预印本,确保您能第一时间接触到科学界最前沿的未经同行评审的原始发现。
我们的团队会即时处理 bioRxiv 发布的每一篇相关预印本,将其转化为通俗易懂的科普摘要与详尽的技术解读,帮助不同背景的读者跨越专业壁垒。无论您是寻求灵感的科研工作者,还是对生命奥秘充满好奇的探索者,这里都能为您提供清晰、及时的资讯。
以下是该领域最新发布的论文列表,邀请您一同开启这场解读生命密码的探索之旅。
本文介绍了 LongcallD,这是一个利用长读长测序数据的局部多重序列比对,能够同时、统一地检测并定相小变异、结构变异及低比例嵌合变异的计算框架,从而显著提升了变异发现的准确性并解决了现有工具将这些问题割裂处理的局限。
该研究揭示了一类在细胞衰老过程中被重编程的应激反应性增强子 RNA(SAeRs,如 EN526)不仅作为增强子动态变化的功能性中介,还能通过调控 CDKN2C 等靶基因的转录后稳定性与翻译,进而驱动衰老表型并关联人类衰老相关性状。
该研究提出了一种仅依赖牛津纳米孔(Nanopore)测序技术的单平台工作流,成功实现了无需多平台数据整合即可构建高质量单倍型解析的端粒到端粒(T2T)人类基因组组装,并同步生成了甲基化图谱和三维染色质互作图谱。
本研究利用 PacBio HiFi、Oxford Nanopore 长读长及 10x Genomics 连锁读长数据,构建了松叶蜂(*Diprion pini*)的高质量近染色体水平基因组,揭示了其独特的线粒体基因组特征及与植物次生代谢物处理相关的特有基因,为松叶蜂的害虫管理提供了关键基因组资源。
该研究通过整合多组学数据与机器学习分析,发现 BAF 染色质重塑复合物通过维持特定转录因子结合位点及“预备态”增强子的可及性,对细胞响应外界刺激(如干扰素γ和地塞米松)时的染色质重塑及基因转录激活至关重要,其功能缺失可能导致疾病发生。
该研究通过分析 1001 个狼基因组揭示欧洲狼并非单一恢复种群,而是由具有不同祖先来源(如北方亚洲血统与南方全新世古老谱系)的多个谱系组成的马赛克结构,且许多孤立种群面临严重的近交衰退和基因组退化,因此呼吁制定基于遗传监测的差异化区域保护策略。
本研究通过整合比较基因组学与 Nano-tRNAseq 技术,首次系统揭示了酵母亚门(Saccharomycotina)中 tRNA 基因序列、修饰酶谱及修饰模式的多样性,阐明了修饰酶的特异性丢失与靶标核苷酸缺失之间的关联,并鉴定了包括原核相关酶 tilS 在内的关键进化特征。
该研究通过对北美鼠耳蝠属(Myotis)8 个物种的基因组及细胞实验分析,揭示了蝙蝠通过针对 DNA 病毒和 RNA 病毒的不同适应机制(如 DNA 病毒互作蛋白的正向选择与 RNA 病毒互作蛋白的拷贝数变异),将长寿、抗癌能力与抗病毒免疫通过多效性进化紧密联系起来。
本文介绍了 causarray 这一鲁棒的因果推断框架,该方法通过整合广义混杂因素调整与半参数机器学习技术,有效解决了单细胞及伪批量基因组数据中未测量混杂因素和选择偏差带来的挑战,并在自闭症和阿尔茨海默病研究中成功识别出具有生物学意义的因果基因与通路。
该研究利用果蝇合胞体胚胎提取物建立了无细胞染色质重构系统,发现长程相互作用和拓扑结构域(TADs)可自发形成,并揭示 eve 基因座 TAD 的形成依赖于 Su(Hw) 介导的边界元件直接配对,而非简单的环挤出模型。