On the consistency of duplication, loss, and deep coalescence gene tree parsimony costs under the multispecies coalescent
本文证明了在多重物种共祖模型下,所有基于线性组合的基因树简约法(GTP)估计量(涵盖重复、丢失和深共祖成本)均具有统计不一致性,并评估了该结论在不同不完全谱系分选水平下的实证影响。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文证明了在多重物种共祖模型下,所有基于线性组合的基因树简约法(GTP)估计量(涵盖重复、丢失和深共祖成本)均具有统计不一致性,并评估了该结论在不同不完全谱系分选水平下的实证影响。
该研究利用多组学数据明确了肺血管周细胞特异性表达 AGTR1 受体,揭示了其在维持肺泡微血管稳态中的关键作用,并发现其信号通路失调与肺气肿等肺部疾病及衰老密切相关,为相关治疗提供了新的细胞特异性靶点。
本文通过构建模拟与真实数据泛基因组图谱,揭示了现有主流流程在识别和表示倒置变异时存在显著差异,并提出了两种倒置气泡拓扑结构及相应的注释工具,指出了当前泛基因组方法在处理倒置变异方面面临的重大挑战。
本研究评估了 DNABERT-2、AgroNT 和 HyenaDNA 三种 DNA 基础模型在植物转录因子结合位点预测中的表现,发现 HyenaDNA 在准确性和计算效率上均优于传统方法,展现了其在植物基因组大规模预测中的巨大潜力。
该研究通过一系列实验表明,空间转录组数据中的稀疏性、噪声以及图像分辨率降低等质量问题会显著削弱基于深度学习的组织学图像基因表达预测性能,且现有的补救措施效果有限,因此强调在优化模型架构之外,提升数据质量是改善预测建模的关键策略。
该研究利用大规模药物组合数据集建立了针对多种协同指标和癌症类型的参考零分布,从而提出了一种能够计算经验 p 值、标准化并严谨评估抗癌药物协同作用的统计框架。
该研究提出了一种整合人类群体遗传变异与三维蛋白质结构的人类空间约束(HuSC)框架,并通过将其用于微调蛋白质语言模型,有效降低了模型对野生型序列的偏差,从而显著提升了变异效应预测的准确性。
本文提出了 SpecLig,一种结合分层 SE(3) 等变变分自编码器与能量引导几何潜在扩散模型的统一框架,旨在通过引入化学先验和能量指导,生成兼具高亲和力与高特异性的靶向 3D 小分子及肽类配体,从而有效解决传统生成模型忽视特异性的问题。
该研究通过量化 FreeSurfer 流程中数值变异性对帕金森病结构 MRI 分析的影响,揭示了其足以改变统计结论并导致假阳性或假阴性结果,进而提出了一种评估数值不确定性的实用框架以保障神经影像研究的可靠性。
本文介绍了 jazzPanda,这是一种针对成像空间转录组数据的混合分析方法,它通过结合空间坐标的“伪批量”策略和线性模型,有效解决了现有工具忽视空间分布的问题,从而显著提高了细胞类型标记基因检测的特异性与空间相关性。