Verticall: A fast and robust tool for recombination detection in large-scale bacterial genomic datasets
本文介绍了 Verticall 这一新型工具,它利用非参数方法高效识别细菌基因组中的重组区域并构建无重组系统发育树,在计算效率、树形合理性及分子定年信号恢复方面表现优异,特别适用于处理从数百到数千个基因组的大规模及高多样性数据集。
756 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 Verticall 这一新型工具,它利用非参数方法高效识别细菌基因组中的重组区域并构建无重组系统发育树,在计算效率、树形合理性及分子定年信号恢复方面表现优异,特别适用于处理从数百到数千个基因组的大规模及高多样性数据集。
本文提出了基于 Transformer 的掩码自监督学习框架 Mievformer,通过编码邻近细胞状态与空间构型来参数化中心位置的细胞状态条件分布,从而实现对微环境异质性与细胞异质性之间概率耦合的定量表征,并在模拟与真实空间转录组数据中展现出优于现有方法的微环境聚类与生物学发现能力。
该研究提出“基因组方言”框架,通过量化分析 1406 个物种的密码子使用偏好,揭示氨基酸理化性质(特别是 Saier 第二密码子碱基分类)与疏水性等特征显著驱动了物种特异性的“信息口音”形成,表明这种偏好主要受翻译保真度与蛋白质稳定性的双重约束,而非单纯的系统发育关系。
该研究提出了名为 memerna 的确定性迭代采样框架,通过按自由能递增顺序枚举 RNA 二级结构,实现了比现有工具快数个数量级的可扩展建模,从而有效解析了包括转录过程中非平衡态折叠在内的复杂 RNA 构象系综。
本文介绍了 SpaceBender,一种利用空间特异性信息(如空间环境 RNA 生态位)来增强空间转录组数据中生物信号、有效去除 RNA 扩散噪声并提升生物学发现显著性的开源去噪方法。
该研究提出了一种基于张量分解的相似性网络框架,通过分析结直肠癌的空间转录组数据,揭示了肿瘤组织受空间结构约束的分子特征及异质性模式,为空间生物标志物发现提供了通用方法。
该研究提出了一种基于差异变化方向性的网络整合框架,通过量化不同数据集间蛋白质上调与下调的一致性,成功将异质性的蛋白质组数据整合为具有生物学意义的网络,揭示了乳腺癌中脂质与胆固醇相关通路的富集特征。
BioEngine 是一个可部署于多种计算环境的执行与适配层,旨在通过代理可读接口弥合生物图像基础模型与可扩展算力之间的鸿沟,使生物学家能够仅通过自然语言描述即可轻松筛选、微调及部署 AI 模型。
该研究提出了一种基于智能体搜索的排序策略,在抗菌肽候选药物优先级排序任务中,其从数千个虚拟筛选结果中精准捕获高价值候选分子的能力显著优于传统加权求和、NSGA-II 及随机权重搜索等方法,并提供了可无缝集成至内部研发流程的开源工具。
本文介绍了由 REMEDi4ALL 联盟开发的开源分层多智能体系统 RepurAgent,该系统通过人机协作模式整合了研究、预测、数据分析和报告生成等模块,成功在急性髓系白血病、COVID-19 抗病毒筛选及多硫酸酯酶缺乏症等多个药物重定位场景中,实现了从假设生成、实验设计到数据分析及候选化合物优化的全生命周期自动化支持。