Structure-informed Siamese graph neural networks classify CirA missense variants with implications for cefiderocol susceptibility
该研究提出了一种结合结构信息与 Siamese 图神经网络的框架,利用基于 CirA 参考结构生成的合成数据训练模型,成功预测了可能损害转运蛋白功能并降低头孢地尔敏感性的 CirA 错义变异。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究提出了一种结合结构信息与 Siamese 图神经网络的框架,利用基于 CirA 参考结构生成的合成数据训练模型,成功预测了可能损害转运蛋白功能并降低头孢地尔敏感性的 CirA 错义变异。
该研究通过整合唐氏综合征患者前额叶皮层和杏仁核的单细胞多组学数据,发现基底星形胶质细胞因表观遗传约束导致对炎症和应激信号的反应能力下降,从而成为唐氏综合征相关阿尔茨海默病中前额叶皮层易损性的关键机制。
本文提出了一种结合微调 Cellpose-SAM 模型与经验贝叶斯方法的端到端分析流程,利用体积电子显微镜技术实现了对肿瘤球体中纳米颗粒分布与细胞超微结构的联合三维重建与定量表征。
本研究系统评估了五种基于主流开源大模型架构的紧凑型变体从头设计单域抗体的能力,发现其生成质量主要取决于训练数据与模型规模而非具体架构差异,并引入了一种结合 MCP 协议与 Claude 模型的自动化代理评估流程以优化候选抗体筛选。
本文介绍了名为 DNAharvester 的 Nextflow 流程,该流程专为处理高度降解的古 DNA 而设计,通过整合元基因组过滤、竞争性比对及多种变异检测策略,有效解决了背景污染和参考偏差等挑战,从而实现了古样本中真实基因组信号的最大化恢复与标准化分析。
该研究揭示了蛋白质语言模型在预测蛋白质适应度时存在“规模不经济”现象,即模型过大导致预测的序列似然值偏离真实的进化模式,从而反而降低了预测性能。
该研究证实,具有天然非共价套索纠缠(NCLEs)且更易发生错误折叠的蛋白质与人类疾病及致病突变的关联显著增强,揭示了此类错误折叠机制是多种功能丧失性疾病的重要成因,并为开发旨在避免错误折叠状态的靶向疗法开辟了新途径。
本研究首次对狗牙根(*Cynodon dactylon*)基因组中的 237 个 NAC 转录因子基因进行了系统鉴定与分类,并揭示了其在不同组织中的表达模式及对干旱、高温、盐渍和淹水等多种非生物胁迫的差异化响应特征,为培育抗逆性更强的狗牙根品种奠定了分子基础。
本文提出了名为 MSI-VISUAL 的开源框架,通过整合四种创新的可视化策略(SALO、SPEAR、TOP3 和 PR3D),实现了高保真、交互式且内存高效的质谱成像分析,从而显著提升了空间分辨率下的分子映射能力并揭示了细微的组织差异。
本文介绍了首个专为纵向单细胞测序数据设计的 LoPhy 方法,该方法通过构建时序一致的克隆树,能够联合推断单核苷酸变异(SNVs)和拷贝数变异(CNAs)的演化轨迹,从而揭示急性髓系白血病等疾病在单细胞分辨率下的进化机制及治疗耐药性。