scTGCL: A Transformer-Based Graph Contrastive Learning Approach for Efficiently Clustering Single-Cell RNA-seq Data
本文提出了一种名为 scTGCL 的基于 Transformer 的图对比学习框架,通过结合多头自注意力机制与数据增强策略,有效解决了单细胞 RNA 测序数据的高维稀疏与噪声问题,在显著降低计算成本的同时实现了优于现有最先进方法的聚类性能。
766 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了一种名为 scTGCL 的基于 Transformer 的图对比学习框架,通过结合多头自注意力机制与数据增强策略,有效解决了单细胞 RNA 测序数据的高维稀疏与噪声问题,在显著降低计算成本的同时实现了优于现有最先进方法的聚类性能。
该论文提出了一种新的线性时间定向算法,将包含特定特征的泛基因组双向图转化为有向图,从而利用现有算法高效识别超气泡(ultrabubbles),显著提升了在大规模泛基因组分析中的计算速度与可扩展性。
GraphBG 是一个统一且可扩展的框架,它通过结合近似谱图卷积与变分贝叶斯高斯混合模型,实现了多切片及多模态空间转录组数据中空间结构域的快速、准确检测与整合分析。
该论文提出了一种名为 KuafuPrimer 的机器学习驱动方法,通过小样本学习为特定细菌群落设计低偏倚的 16S rRNA 基因引物,显著提升了分类学准确性并成功检测出通用引物遗漏的关键病原体,从而在大规模微生物组研究、纵向调查及临床诊断中展现出巨大潜力。
本文介绍了 MetaGEAR Explorer 这一网络分析平台,它整合了来自 24 个队列的 9,053 个宏基因组样本及超过 3300 万个微生物基因家族数据,支持通过序列或结构域进行交互式搜索、跨队列疾病关联分析及物种分类溯源,从而助力研究人员快速开展肠道微生物基因与疾病(如炎症性肠病和结直肠癌)的功能性荟萃分析。
该研究表明,AI 基础模型 Boltz-2 在针对十个具有体外结合实验数据的超大规模虚拟筛选数据集的评估中,表现优于其他重评分策略,其分类成功率翻倍,能够利用普通计算资源对百万级化合物进行准确、高效且稳健的排序。
本文提出了一种名为 SIR 的非参数框架,通过二维等距回归定义药物相互作用并结合自由度校正的野自举法生成校准 P 值,从而在药物组合筛选中显著提升了结果的可重复性、预测准确性及统计推断能力,有效解决了传统评分方法缺乏统计检验且易因参数拟合失败而失效的问题。
本文介绍了 CosMxScope,这是一个轻量级开源 Python 框架,旨在将 CosMx 空间分子成像仪产生的高分辨率空间转录组数据(如图像瓦片、转录坐标和细胞分割多边形)无缝整合到数字病理学工作流中,通过拼接全切片图像、转换 GeoJSON 格式以支持 QuPath 分析以及生成空间可视化图表,从而促进转化医学研究中对细胞形态与基因表达模式的交互式探索。
该论文介绍了一款名为"Track Hub Quickload Translator"的免费网络应用,它能够将 UCSC 基因组浏览器和集成基因组浏览器(IGB)的数据格式相互转换,从而使研究人员能够利用这两种浏览器访问数万个已发表的基因组组装数据。
本文介绍了 VaLPAS 框架,这是一个基于 Python 的多组学数据分析工具,旨在通过利用实验数据中的变异模式及“关联推断”策略,揭示蛋白质功能未知区域并预测其功能。