A ML-framework for the discovery of next-generation IBD targets using a harmonized single-cell atlas of patient tissue
该研究提出了一种结合机器学习与实验验证的整合框架,利用百万级肠道单细胞图谱成功识别并验证了针对炎症性肠病(IBD)的新型细胞类型特异性治疗靶点,为精准药物发现提供了可扩展的新范式。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究提出了一种结合机器学习与实验验证的整合框架,利用百万级肠道单细胞图谱成功识别并验证了针对炎症性肠病(IBD)的新型细胞类型特异性治疗靶点,为精准药物发现提供了可扩展的新范式。
该研究提出了一种名为 FragBEST-Myo 的基于深度学习的语义分割工具,利用分子动力学轨迹中的局部形状和理化特征,成功实现了对心脏肌球蛋白结合位点片段结合倾向的预测,从而为基于集合的对接筛选和片段导向的药物设计提供了有效方法。
该研究通过模拟和实验验证,评估了七种变异检测工具在结核分枝杆菌低频变异检测中的性能,发现基于单倍型的 FreeBayes 表现最佳,并开发了一种新的误差过滤模型,在显著降低假阳性率的同时保留了极高的真阳性检出率。
本文介绍了 Clair3 v2,一种利用牛津纳米孔(ONT)测序产生的轻量级移动表(move table)及信号驻留时间信息,在几乎不增加计算开销的前提下显著提升小变异(尤其是长插入缺失)检测精度且运行高效的新型变异识别方法。
本文介绍了名为 CryoZeta 的从头结构建模程序,该程序利用基于扩散的生成式深度学习网络,将冷冻电镜密度图特征与类似 AlphaFold3 的生物大分子结构预测流程相结合,从而在高达 10 埃的分辨率下实现了比现有方法更精确的蛋白质及核酸复合物原子级建模。
本文提出了首个用于评估复杂人类性状空间细胞定位方法的综合框架 SMECT,通过基准测试揭示了现有方法在灵敏度与特异性间的权衡,并证明 DESE 方法在各类场景下均能实现高功效与稳健的特异性。
IntelliFold-2 是一款开源生物分子结构预测模型,通过架构优化和多尺度结构一致性策略,在抗体 - 抗原相互作用及蛋白 - 配体共折叠等治疗相关场景下实现了超越 AlphaFold 3 的预测精度与鲁棒性,并发布了涵盖高效微调至高精度推理的三种变体。
MassID 是一款基于云的无靶向代谢组学分析流程,它通过深度学习去噪和引入 DecoID2 模块实现概率性代谢物鉴定,从而在人类血浆数据中实现了近完整的信号注释,鉴定出超过 4,000 种代谢物(其中 1,200 多种在 5% 错误发现率下),显著提升了代谢组学分析的覆盖度与特异性。
该论文介绍了包含超过 22,000 个手动标注细胞群提及的 CellLink 语料库,通过系统分析揭示了细胞命名模式,并利用该资源优化了基于 Transformer 的命名实体识别与零样本实体链接模型,同时展示了其在扩展和细化细胞本体(Cell Ontology)中的实际应用价值。
本文介绍了 CPLfold,一种能够利用 RNA 交联连接实验证据、在几乎线性时间内高效预测包含假结在内的长序列 RNA 二级结构的快速灵活方法。