A structure-informed deep learning framework for modeling TCR-peptide-HLA interactions
本文提出了名为 StriMap 的结构信息深度学习框架,通过整合理化、序列上下文及结构特征实现了 TCR-肽-HLA 相互作用的高精度预测,并成功应用于强直性脊柱炎等自身免疫疾病的抗原驱动因素解析与免疫治疗设计。
1238 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文提出了名为 StriMap 的结构信息深度学习框架,通过整合理化、序列上下文及结构特征实现了 TCR-肽-HLA 相互作用的高精度预测,并成功应用于强直性脊柱炎等自身免疫疾病的抗原驱动因素解析与免疫治疗设计。
本文提出了 CardamomOT,一种基于机理最优传输的新框架,通过整合精确时间标签和先验知识,在单细胞转录组时间序列分析中实现了基因调控网络推断、未观测蛋白轨迹重建及扰动响应生成的统一与高精度建模。
本文提出了一种名为 TRACE 的轻量级多模态框架,通过引入 CLIP 风格的实体内对比对齐机制,有效解决了 TCR-肽段结合预测中因结构数据噪声导致的多模态融合失效问题,证明了在生物信息学应用中,通过约束模态交互优化比单纯增加模态更能提升模型的鲁棒性与性能。
该研究展示了利用纳米孔测序技术对 10x Genomics 多组学文库进行全长转录本分析,成功实现了遗传解复用,并验证了其在转录起始位点(TSS)识别方面的有效性,尽管其检测灵敏度略低于短读长 5'端测序方法。
本文提出了一种名为 U-method 的快速概率框架,通过对比基因在特定簇内的表达概率与其在其他簇中的最高表达概率来识别独特表达基因,从而在单细胞转录组分析中实现了比传统平均表达差异更稳健的细胞群标记物发现及无需平滑或反卷积的空间组织解析。
GeoBridge 是一种基于等测测地线理论的新框架,它通过构建非线性转录流形与线性潜在流形之间的测地线桥梁,将稀疏的单细胞时间序列数据转化为连续且可控的细胞状态转换景观,从而实现了对未观测中间状态的生物意义重建、动态驱动基因的识别以及不同细胞表型间的可控导航。
该研究开发了一种名为 MAPPER 的多模态预测框架,通过分析大肠杆菌的蛋白质组学、化学结构及生长动态等多维度数据,实现了对抗生素作用机制的准确分类及新机制化合物的识别,从而助力新型抗菌候选药物的优先筛选。
该论文介绍了 HalluCodon 框架,它利用多模态语言模型和基于“幻觉”的设计策略,通过微调预训练模型来生成符合特定植物物种密码子使用偏好并能支持高水平表达的优化编码序列。
本研究评估了 FoldX5.1 在 MAVISp 稳定性数据收集中的适用性,结果显示其与旧版 FoldX5 具有高度一致性,支持将其纳入未来数据更新并制定了相应的过渡方案。
本文介绍了 EMITS,一种基于 Rust 开发的期望最大化(EM)算法工具,旨在通过迭代解析长读长真菌 ITS 扩增子测序中的模糊比对,解决传统最佳匹配分类法导致的物种丰度误判问题,从而提供高精度的物种水平丰度估计。