STEQ: A statistically consistent quartet distance based species tree estimation method
本文提出了一种名为 STEQ 的新方法,该方法基于统计一致的四分体距离度量,能够在多物种溯祖模型下以 的线性时间复杂度快速且准确地从大量基因树中推断物种树,其速度优于 ASTRAL 等主流方法同时保持了相当的准确性。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了一种名为 STEQ 的新方法,该方法基于统计一致的四分体距离度量,能够在多物种溯祖模型下以 的线性时间复杂度快速且准确地从大量基因树中推断物种树,其速度优于 ASTRAL 等主流方法同时保持了相当的准确性。
该研究提出了一种结合振动光谱与深度学习的快速、无标记方法,仅需微量样品和简单预处理即可高精度地量化 DNA 片段长度分布,为基因组工作流程提供了一种可扩展的替代方案。
该研究开发了一种基于常规 H&E 染色病理图像的弱监督深度学习框架,能够直接识别肿瘤中的染色体外 DNA(ecDNA)扩增状态,从而为临床提供可扩展的筛查手段以优化分子检测优先级。
该论文提出了一种名为 ExoFILT 的基于深度学习和迁移学习的分类器,用于从单粒子追踪数据中自动识别外泌事件,该方法将人工注释时间减少了十倍并提高了结果的一致性,从而能够系统量化外泌蛋白间的时序关系并揭示具有不同分子组成的外泌事件亚群。
本文提出了名为 APEX 的可解释人工智能框架,该框架通过结合进化嵌入与图注意力网络实现跨物种病原体靶点发现,并利用注意力机制指导结构生成模型进行定向分子设计,从而为抗微生物药物研发提供了一条从靶点优先排序到抑制剂生成的端到端解决方案。
本文介绍了 GTA-5 框架,这是一个统一的图 Transformer 自编码器,通过将配体和蛋白口袋表示为带有 Tripos 原子类型标签的三维点云(而非显式键连接),将二者嵌入反映功能兼容性的多维潜在空间,从而为药物发现中的结构推理、虚拟筛选及药物重定位等下游应用奠定基础。
BiGAT-Fusion 提出了一种节点门控双向图注意力融合模型,通过分别利用基于相似性的特征视图和显式建模方向性的拓扑视图,并采用自适应门控机制动态整合多源证据,从而在药物重定位任务中有效解决了类别不平衡、方向不对称及静态融合等挑战,实现了最先进的预测性能。
本文提出了 scDynOmics,一种受基因调控网络启发并采用 Linformer 注意力机制的预训练 Transformer 模型,它通过单细胞多组学数据学习紧凑的细胞状态嵌入,并利用低秩适应模块实现高效微调,从而在细胞分类、发育轨迹解析及扰动响应预测等任务中达到最先进水平。
该研究提出了一种名为“多尺度符号形态条形码(MMB)”的新框架,通过将小鼠全脑神经元的复杂形态转化为可解释的多尺度符号表示,成功揭示了神经元组织在区域特异性和尺度依赖性方面的规律,并实现了将形态学与全脑尺度的连接及功能进行系统性整合。
本研究结合网络药理学与动物实验,证实了三七(Panax notoginseng)通过多成分、多靶点及多通路(如 NF-κB、MAPK 等)协同调控 TNF-α、IL-6 和 IL-10 等炎症因子,从而优化炎症启动至组织重塑的动态过程,有效促进皮肤伤口愈合。