CoLa-VAE: Cell-Cell Communication-aware Variational Autoencoder with Dynamic Graph Laplacian Constraints
本文提出了 CoLa-VAE,这是一种将细胞间通讯约束(基于配体 - 受体相互作用的动态图拉普拉斯正则化)整合到变分自编码器中的深度生成框架,旨在从内在转录异质性中解耦通讯驱动拓扑,从而在多种测序平台上实现优于现有方法的聚类与去噪性能。
1242 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了 CoLa-VAE,这是一种将细胞间通讯约束(基于配体 - 受体相互作用的动态图拉普拉斯正则化)整合到变分自编码器中的深度生成框架,旨在从内在转录异质性中解耦通讯驱动拓扑,从而在多种测序平台上实现优于现有方法的聚类与去噪性能。
本文介绍了“乳糜泻微生物组库”(CMR),这是一个通过系统整理、重新分析和统一元数据,将全球分散的乳糜泻肠道微生物组测序数据整合为包含 3,245 个样本的开放访问资源,旨在消除数据壁垒并推动该领域的大规模荟萃分析与机器学习研究。
该论文提出了一种名为 KuafuPrimer 的机器学习驱动方法,通过小样本学习为特定细菌群落设计低偏倚的 16S rRNA 基因引物,显著提升了分类学准确性并成功检测出通用引物遗漏的关键病原体,从而在大规模微生物组研究、纵向调查及临床诊断中展现出巨大潜力。
本文提出了一种名为 GIDEON 的新型整数线性规划框架,通过改进的边加权方案和搜索算法,在酿酒酵母遗传相互作用网络中识别出规模更大且功能富集度更高的通路间模型(BPMs),从而揭示了包括抗真菌药物靶点在内的潜在补偿通路。
本文介绍了 HORI-EN,一种结合理化与知识基础混合能量评分及归一化相互作用分数(NIS)的新型工具,能够识别蛋白质结构中的高阶残基相互作用簇,从而在突变热点预测、结构区分及进化保守性分析中展现出卓越性能。
本文提出了一种利用邻接矩阵 Krylov 子空间行(即 Krylov 轨迹)来分析生物网络的方法,通过结合特定生物状态或扰动的初始向量进行幂迭代,从而在秀丽隐杆线虫(C. Elegans)神经网络的社区检测和扰动分析中有效提取节点的功能信息。
本文介绍了 MetaGEAR Explorer 这一网络分析平台,它整合了来自 24 个队列的 9,053 个宏基因组样本及超过 3300 万个微生物基因家族数据,支持通过序列或结构域进行交互式搜索、跨队列疾病关联分析及物种分类溯源,从而助力研究人员快速开展肠道微生物基因与疾病(如炎症性肠病和结直肠癌)的功能性荟萃分析。
本文提出了 TEA-GCN 方法,通过利用无监督转录组数据划分和多指标共表达评分的集成策略,克服了现有基因共表达网络构建对批次效应和样本组成的敏感性,在跨物种功能预测、调控网络推断及可解释性方面均优于现有最先进方法。
该研究表明,AI 基础模型 Boltz-2 在针对十个具有体外结合实验数据的超大规模虚拟筛选数据集的评估中,表现优于其他重评分策略,其分类成功率翻倍,能够利用普通计算资源对百万级化合物进行准确、高效且稳健的排序。
本文提出了一种名为 SIR 的非参数框架,通过二维等距回归定义药物相互作用并结合自由度校正的野自举法生成校准 P 值,从而在药物组合筛选中显著提升了结果的可重复性、预测准确性及统计推断能力,有效解决了传统评分方法缺乏统计检验且易因参数拟合失败而失效的问题。