BARTsc identifies key transcriptional regulators from single-cell omics data
本文介绍了 BARTsc 这一新型计算方法,它通过利用大规模公共 ChIP-seq 数据从单细胞组学数据中推断顺式调控特征,从而更准确地识别细胞类型特异性关键转录因子,并在多种生物系统中展现出优于现有方法的性能及实验验证价值。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 BARTsc 这一新型计算方法,它通过利用大规模公共 ChIP-seq 数据从单细胞组学数据中推断顺式调控特征,从而更准确地识别细胞类型特异性关键转录因子,并在多种生物系统中展现出优于现有方法的性能及实验验证价值。
本文介绍了 MetaOmixTools,这是一个无需编程的交互式网络工具套件,旨在通过整合 MetaRank(排名聚合)和 MetaEnrich(功能富集)模块,帮助研究人员克服统计障碍,对多个独立研究的排序特征列表和功能富集结果进行稳健的元分析,从而从多组学数据中提取一致的生物学见解。
TopoMetry 是一个能够直接从单细胞数据中学习并评估其潜在几何结构的统一框架,它通过构建高保真谱骨架来克服传统静态投影的局限,从而更可靠地揭示细胞多样性及潜在的生物学信号。
该研究表明,基于机器学习的 MS2Rescore 重评分工具能显著提升宏蛋白质组学中的肽段鉴定率与特异性,从而在降低假阳性率的同时增强下游分类注释的可靠性。
该研究通过对系统性红斑狼疮患者进行转录组分析,揭示了不同皮肤亚型(如亚急性皮肤型狼疮与皮肤溃疡)具有独特的免疫特征和信号通路,为针对特定皮肤表型的精准治疗提供了新靶点。
本文提出了名为 EnhancerDetector 的可解释深度学习框架,该模型基于人类数据训练,能够跨物种(包括人类、小鼠和果蝇)高精度地预测增强子,并通过实验验证证实了增强子序列具有可识别的内在特征(即“增强子性”)。
本文通过构建多维度基准测试框架,系统评估了多种分子指纹在大规模数据集上的表现,揭示了折叠导致的位碰撞会严重扭曲相似度计算,而采用计数(或对数计数)及未折叠变体能显著提升特异性与结构一致性,并为此发布了开源 Python 库 chemap 以支持可复现的基准测试。
该研究通过模拟与实证分析表明,判断种群是否属于“可测量进化种群”或达到“系统动力学阈值”不仅取决于数据本身,更受模型假设和采样策略的影响,且评估先验敏感性比检验时间信号更为关键。
本文提出了基于多模态蛋白质语言模型的两阶段后训练生成模型 EiRA,通过优化训练策略实现了对多种生物分子(包括 DNA)的高多样性、高可设计性通用结合蛋白的“单次”设计,并经由实验验证了其制造可行性与结合亲和力。
该研究通过构建包含 27 万余个人类免疫细胞的多模态单细胞图谱,揭示了在 HIV、COVID-19、流感病毒及有机磷暴露下,免疫细胞基因调控景观的表观遗传重塑动态及其在转录因子结合位点上的协同变化机制。