Locat: Joint enrichment and depletion testing identifies localized marker genes in single-cell transcriptomics
本文提出了 Locat 框架,通过联合测试基因表达在细胞嵌入空间中的富集与耗散,识别出具有高特异性的局部标记基因,从而在无需批次校正的情况下实现跨条件、多样本的单细胞转录组比较,并有效揭示细胞谱系组织及动态调控程序。
762 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了 Locat 框架,通过联合测试基因表达在细胞嵌入空间中的富集与耗散,识别出具有高特异性的局部标记基因,从而在无需批次校正的情况下实现跨条件、多样本的单细胞转录组比较,并有效揭示细胞谱系组织及动态调控程序。
本文提出了名为 CASPA 的全自动单细胞蛋白质组学分析流程,通过整合自适应质控、熵引导批校正及结合结构化矛盾推理的大语言模型上下文感知注释,有效解决了现有方法在数据缺失、背景污染及细胞类型标注主观性等方面的局限,并在多个生物数据集上验证了其高准确性与可重复性。
该研究利用多品种参考面板,证实了超深度全基因组测序(ulcWGS)结合非线性回归模型,能够以低成本、高可靠性的方式准确估算不同血统犬只的近交系数和纯合子片段(RoH)。
REBEL 是一个旨在解决生物信息学中长期可重复性和可访问性挑战的框架,它通过源代码深度检查、模糊匹配及保守依赖锁定等机制自动解析并归档显式系统级依赖,从而为研究人员提供无需容器化专业知识即可构建确定性、FAIR 合规计算环境的解决方案。
该研究利用流动分子动力学模拟,揭示了糖基化修饰通过调节 A1 结构域中的自抑制模块,介导血管性血友病因子(VWF)在血流剪切力作用下从自抑制态向激活态转变的分子机制。
该研究利用 AlphaFold2 发布的准实验机会,通过追踪蛋白质数据库及下游文献数据,证实人工智能预测能够扭转对新颖蛋白质研究的长期衰退趋势,将科学界的集体注意力重新导向此前被忽视的科研前沿,从而扩展了科学探索的边界。
本文概述了作者为 Fiji(ImageJ)和 Python 开发的扫描电子显微镜图像分析工具插件,这些工具涵盖了信噪比、对比度及分辨率分析,并支持自定义 FIB-SEM 图像的导入,相关代码已在 GitHub 开源。
RastQC 是一款用 Rust 编写的高性能测序质量控制工具,它通过单二进制文件统一了短读长和长读长分析,在保持与 FastQC 完全一致的结果的同时,显著提升了处理速度并降低了内存消耗。
该研究通过对 65 个古菌类群中超过 12 万种蛋白质的系统分类分析发现,古菌在单结构域层面的折叠 repertoire 与已知生命形式高度保守,其结构新颖性被低估主要归因于序列分歧导致的分类敏感性不足,而非存在大量未知的新型结构。
该研究提出了一种比现有方法快 100 多倍的基于 k-mer 的快速算法,用于从组装基因组中推断遗传密码,并成功应用于数千个细菌和古菌样本,从而发现了新的遗传密码变体,包括首个古菌密码子重新分配案例。