Assessment of Generative De Novo Peptide Design Methods for G Protein-Coupled Receptors
该研究通过基准测试评估了针对 G 蛋白偶联受体(GPCR)的生成式从头多肽设计方法,发现尽管现有深度学习工具在多肽骨架采样方面表现尚可,但在验证阶段普遍存在置信度高估和序列生成能力不足的问题,揭示了当前多肽设计流程中评分机制失效及模型记忆化等关键挑战。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究通过基准测试评估了针对 G 蛋白偶联受体(GPCR)的生成式从头多肽设计方法,发现尽管现有深度学习工具在多肽骨架采样方面表现尚可,但在验证阶段普遍存在置信度高估和序列生成能力不足的问题,揭示了当前多肽设计流程中评分机制失效及模型记忆化等关键挑战。
该研究通过基准测试发现,现有空间域分割算法因过度关注转录组局部方差而难以识别功能性的组织微环境(niche),并证明通过策略性加权核心功能谱系可有效提升在非分隔组织中识别微环境边界的精度,从而揭示了当前方法在区分结构域与功能微环境方面的局限性。
该研究通过单核转录组学分析揭示,肾小球足细胞在衰老过程中表现出具有空间特异性的协调状态转变(主要发生在髓旁区),而非普遍性退化,这为理解肾单位区域易感性及制定针对肾小球细胞和空间复杂性的未来治疗策略提供了机制解释。
本文介绍了 SpatialLeiden 算法的扩展版本,该算法通过基于批次校正潜在空间的灵活邻接图复用,实现了支持 3D 序列切片及多模态数据的 atlas 级大规模空间聚类,在标准硬件上展现出卓越的模块化、可扩展性及与脑图谱的一致性,并兼容 scverse 生态以促进广泛采用。
本文提出了一套综合评估框架,对五种深度学习 Hi-C 预测模型进行了系统 benchmarking,发现 Epiphany 模型在预测精度、泛化能力及生物学解释性方面表现最优,并证实 CTCF 结合与染色质可及性是驱动准确预测的关键特征。
本文介绍了 PubMed Atlas,这是一个集命令行与交互式仪表板于一体的可重复工作流框架,旨在通过程序化获取和结构化处理 PubMed 海量文献元数据,实现对生物医学领域出版趋势、地理分布及研究空白的系统性分析与可视化探索。
HMM-Flagger 是一种基于隐马尔可夫模型和读段覆盖度的无参考基因组组装错误检测工具,能够有效识别结构异常,并在 HG002 及人类泛基因组参考联盟(HPRC)的组装评估中成功揭示了包括卫星区域在内的多种大规模错误并验证了新型结构变异。
本文介绍了 TreeMS2 这一可扩展的计算工具,它通过直接比较串联质谱(MS/MS)谱图来构建相似性矩阵,从而在不依赖谱图注释的情况下,从蛋白质组和代谢组数据中推断出反映分子表型进化关系及功能适应的分子系统发育树。
该研究通过电子密度引导的 AlphaFold3 方法,成功揭示了β2-微球蛋白中传统晶体学精修未能捕捉的构象异质性,并阐明了电子密度质量及晶体堆积条件对构象系综检测的影响,为全面解析晶体中蛋白质结构景观提供了稳健的系统框架。
本研究通过分析 869,964 条缺乏 HisKA 结构域但含有 HATPase 结构域的不完整组氨酸激酶序列,成功鉴定出 18 种 HisKA 样结构域,并通过三维结构比对、基因组上下文分析及交叉验证,证实了这些新结构域的功能特性,从而有助于完善原核生物信号转导通路的注释。