scVIP: personalized modeling of single-cell transcriptomes for developmental and disease phenotypes
本文介绍了 scVIP,这是一种结合生成模型与细胞类型感知多实例学习的生成式框架,能够将单细胞转录组数据转化为个性化个体嵌入,从而有效预测发育年龄、疾病进展及神经病理特征,并整合具有不同表型定义的异质数据集以揭示神经退行性疾病的关键细胞群体和转录程序。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 scVIP,这是一种结合生成模型与细胞类型感知多实例学习的生成式框架,能够将单细胞转录组数据转化为个性化个体嵌入,从而有效预测发育年龄、疾病进展及神经病理特征,并整合具有不同表型定义的异质数据集以揭示神经退行性疾病的关键细胞群体和转录程序。
本文介绍了由 REMEDi4ALL 联盟开发的开源分层多智能体系统 RepurAgent,该系统通过人机协作模式整合了研究、预测、数据分析和报告生成等模块,成功在急性髓系白血病、COVID-19 抗病毒筛选及多硫酸酯酶缺乏症等多个药物重定位场景中,实现了从假设生成、实验设计到数据分析及候选化合物优化的全生命周期自动化支持。
本文提出了 Surleton 框架,通过联合建模蛋白质骨架几何与表面组织信息,有效弥补了仅依赖骨架表示的不足,显著提升了逆折叠任务中尤其是表面暴露残基的序列恢复性能。
该研究通过比较沙囊科(形成包囊)与艾美耳科(不形成包囊)寄生虫的蛋白质组,利用系统发育分析揭示了弓形虫缓殖子分化既涉及高度保守的通路,也包含该科特有的通路,并据此鉴定出包含已知调控因子及潜在新型缓殖子分化蛋白的保守簇。
本文提出了首个基于确定性常微分方程模型的 DNA 羟甲基化速度框架 HMCVelo,利用联合单细胞测序技术从静态快照中解析表观遗传动态,在推断细胞轨迹的置信度上显著优于 RNA 速度,并揭示了封闭生化系统中互补变量无法解析轨迹分叉的理论限制。
该论文介绍了一种基于变分自编码器 MetVAE 的计算协议,用于从大规模非靶向代谢组学数据中构建反映功能关系的分子网络,并通过肝癌小鼠模型揭示了高脂饮食下脂质类群间的内源性“自体酿酒”代谢途径。
该研究提出了一种闭环多目标优化框架,通过结合生成模型、分子模拟与贝叶斯优化,成功设计了具有更高 CXCR4 选择性且能降低 NRP1 非特异性结合的细胞穿透肽。
scSketch 是一款交互式工具,允许用户通过手绘轨迹探索单细胞数据中的基因表达梯度,并结合在线错误发现率控制与 Reactome 通路分析,在保持统计有效性的同时揭示细胞分化及病毒感染等连续生物学过程的机制。
ProNA3D 是一款集成了实验与预测结构分析、界面可视化及密度分区功能的统一平台工具,旨在通过距离分析方法深入解析包含核酸的生物分子复合物界面及其功能特征。
该研究通过构建基于网络的功能相互作用框架,揭示了炎症性肠病(IBD)中肠道微生物组的失调并非源于功能能力的丧失,而是表现为从分布式组织向碎片化、脆弱化网络结构的系统性重组。