A Cross-Study Multi-Organ Cell Atlas ofMacaca fascicularis Informed by Human Foundation Model Annotation: A Resource for Translational Target Assessment
该研究构建了迄今为止最大规模的食蟹猴多器官单细胞转录组图谱,并通过人类基础模型实现了跨物种细胞类型注释,为生物制剂的靶点评估、毒性机制解析及减少非人灵长类动物使用提供了关键资源。
1244 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究构建了迄今为止最大规模的食蟹猴多器官单细胞转录组图谱,并通过人类基础模型实现了跨物种细胞类型注释,为生物制剂的靶点评估、毒性机制解析及减少非人灵长类动物使用提供了关键资源。
本文提出了 ProteinSage 框架,通过引入结构引导掩码和因果目标等显式结构约束,实现了在更少数据下高效学习具有结构忠实性的蛋白质表示,并成功应用于发现新型微生物视紫红质同源蛋白。
SNMF 是一种首个原生支持 GPU 加速的无参考空间转录组去卷积方法,它通过引入空间混合矩阵建模邻域影响,在保持极低计算耗时(不足一分钟)的同时显著提升了去卷积精度并成功恢复了具有生物学意义的细胞特征。
该研究结合 AlphaFold-3 与分子动力学模拟构建了高分辨率水合模型,揭示了 RHEB 通过重塑 mTORC1 整体构象、增强 mTOR-RAPTOR 相互作用并优化 ATP 结合环境,从而在底物结合前实现激酶催化态变构预组织的激活机制。
本文介绍了 evedesign,这是一个统一的开源框架,旨在通过提供方法无关的条件生物序列设计、支持多目标优化及实验闭环迭代,并配备交互式网页界面,从而解决现有机器学习蛋白工程工具互操作性差且难以被非专家使用的问题。
本文介绍了 GAP-MS,一种利用质谱证据自动验证并优化作物基因预测的蛋白质组学流程,该工具不仅能显著提高预测精度、过滤错误模型,还能发现标准注释中缺失的基因并构建高置信度参考蛋白质组。
本文介绍了 StrucTTY,这是一款专为高性能计算和 SSH 会话等纯文本终端环境设计的交互式蛋白质结构可视化工具,支持实时旋转、缩放、多结构对比及二级结构展示。
该研究开发了一种结合关键词搜索、隐马尔可夫模型和结构比对的结构引导工作流程,成功识别并重新注释了蛋白质数据库(PDB)中所有 1513 个细胞色素 P450 沉积物,建立了首个经过严格人工验证且与结构关联的 P450 酶标准化注册库。
本文提出了 SELFormerMM 框架,通过整合 SELFIES 符号、分子结构、文本描述及知识图谱中的生物交互数据,实现了多模态分子表征学习,从而在多种分子属性预测任务中超越了单一模态模型。
本文提出了一种名为 Super Bloom 的过滤器,它通过利用最小化子将相邻 k-mer 分组并映射至同一内存块,结合 findere 方案,在生物序列流式查询中显著提升了缓存效率与查询速度,同时大幅降低了误报率。