Predicting Pre-treatment Resistance or Post-treatment Effect? A Systematic Benchmarking of Single-Cell Drug Response Models
该研究通过大规模基准测试揭示,现有单细胞药物响应模型在细胞系中表现较好但难以预测治疗前的内在耐药性,且在类别不平衡下性能显著下降,从而凸显了开发具有更强临床相关性、能应对肿瘤异质性和极端不平衡问题的下一代模型的迫切需求。
756 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究通过大规模基准测试揭示,现有单细胞药物响应模型在细胞系中表现较好但难以预测治疗前的内在耐药性,且在类别不平衡下性能显著下降,从而凸显了开发具有更强临床相关性、能应对肿瘤异质性和极端不平衡问题的下一代模型的迫切需求。
本文介绍了"found",这是一个用 Python 和 R 实现的 HiDDEN 方法框架,旨在从单细胞数据的结构化标签噪声中推断细胞级扰动,并通过基准测试表明其性能高度依赖于回归、分组和嵌入维度等建模选择。
本文提出了一种名为 CloneMLP-NPE 的基于模拟的贝叶斯推断框架,利用神经网络后验估计和归一化流技术,直接从单细胞测序拷贝数变异(CNA)谱中高效且准确地重构肿瘤内适应性景观并量化不确定性,其性能优于现有的基于集合 Transformer 和共识克隆的基线方法。
本文介绍了 BioClaw,这是一个将群聊转化为持久化执行工作空间的生物医学人机协作生态系统,它能够将群聊中的自然语言请求转化为基于隔离容器和丰富生物医学工具的自动化分析,从而支持跨多平台、多领域的高效科研协作。
GraphMana 是一种面向群体基因组学项目的原生图数据管理系统,它通过将变异数据存储为打包基因型数组并预计算群体统计信息,解决了传统基于文件的工作流在样本扩展、谱系追踪和重处理方面的局限性,在 1000 基因组项目测试中实现了从单一持久化数据库高效完成全生命周期操作的目标。
GraphPop 是一款基于图数据库的计算引擎,通过将群体基因组学分析的复杂度从与样本量线性相关降低为仅与群体数量相关,实现了在极低内存占用下对大规模数据集(如水稻 3K 和人类 1000 基因组)进行超高速、可组合且注释集成的群体遗传分析。
该研究通过 TB-Bench 基准测试系统评估了多种机器学习与深度学习方法在预测二线抗结核药物耐药性方面的表现,发现传统机器学习模型在内部测试中优于深度学习模型,但两者在外部验证中均未显著超越基于目录的传统方法,揭示了当前模型在跨数据集泛化及临床转化方面仍面临的关键挑战。
本文提出了 IMAS 框架,该框架利用泛癌单细胞多组学资源,通过目标域适应和通信引导建模,有效整合稀疏异质的肿瘤多组学数据,从而在数据受限条件下解析出可解释的、由细胞间通讯驱动的调控机制。
本文介绍了由 dPCR 社区协作开发的轻量级跨平台标准“数字 PCR 数据核心标准”(DDES),旨在通过统一包含实验元数据、检测化学及原始荧光数据的三种文件格式,解决不同仪器间的数据互操作性问题,从而推动临床与研究领域的 FAIR 数据实践及可重复性研究。
DyME 是一个集成了高通量突变、溶剂化分子动力学模拟及对比分析工具箱的分布式平台,旨在通过自动化处理数千个分子系统并整合轨迹数据,系统性地研究蛋白质识别模拟与工程改造。