Learning fragment-based segmentation of binding sites from molecular dynamics: a proof-of-concept on cardiac myosin.
该研究提出了一种名为 FragBEST-Myo 的基于深度学习的语义分割工具,利用分子动力学轨迹中的局部形状和理化特征,成功实现了对心脏肌球蛋白结合位点片段结合倾向的预测,从而为基于集合的对接筛选和片段导向的药物设计提供了有效方法。
769 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究提出了一种名为 FragBEST-Myo 的基于深度学习的语义分割工具,利用分子动力学轨迹中的局部形状和理化特征,成功实现了对心脏肌球蛋白结合位点片段结合倾向的预测,从而为基于集合的对接筛选和片段导向的药物设计提供了有效方法。
该研究通过模拟和实验验证,评估了七种变异检测工具在结核分枝杆菌低频变异检测中的性能,发现基于单倍型的 FreeBayes 表现最佳,并开发了一种新的误差过滤模型,在显著降低假阳性率的同时保留了极高的真阳性检出率。
本文介绍了 Clair3 v2,一种利用牛津纳米孔(ONT)测序产生的轻量级移动表(move table)及信号驻留时间信息,在几乎不增加计算开销的前提下显著提升小变异(尤其是长插入缺失)检测精度且运行高效的新型变异识别方法。
IntelliFold-2 是一款开源生物分子结构预测模型,通过架构优化和多尺度结构一致性策略,在抗体 - 抗原相互作用及蛋白 - 配体共折叠等治疗相关场景下实现了超越 AlphaFold 3 的预测精度与鲁棒性,并发布了涵盖高效微调至高精度推理的三种变体。
该论文介绍了包含超过 22,000 个手动标注细胞群提及的 CellLink 语料库,通过系统分析揭示了细胞命名模式,并利用该资源优化了基于 Transformer 的命名实体识别与零样本实体链接模型,同时展示了其在扩展和细化细胞本体(Cell Ontology)中的实际应用价值。
该研究开发了一种结合图神经网络与 XGBoost 分类器的混合机器学习框架,成功筛选并实验验证了两种新型小分子化合物(berberrubine 和 PE859),它们能有效抑制 TDP-43 聚集并在秀丽隐杆线虫模型中改善运动缺陷,为神经退行性疾病的治疗提供了新候选药物。
本文提出了 CodonRL,一种结合演示引导强化学习与快速折叠反馈的多目标同义密码子序列优化框架,其在 55 种人类蛋白基准测试中显著优于现有最先进方法 GEMORNA,实现了更高的翻译效率、更优的 RNA 结构稳定性及更低的免疫原性。
该研究通过整合进化保守性和结构距离等五个关键特征,构建了一个基于机器学习的计算模型,能够准确预测结核分枝杆菌 Rv0678 基因变异对贝达喹啉表型的影响,从而辅助耐药结核病的治疗管理。
本文提出了 Theseus,一种新颖且快速的算法,它利用基因组序列相似性和稀疏数据策略,在保持最优仿空位对齐的同时,显著降低了内存和计算开销,从而在多重序列比对和泛基因组读段映射任务中实现了优于现有最优及启发式方法的速度与性能。
本文开发了 GeneReL 平台,通过结合大语言模型(LLM)的高效提取能力与社区驱动的协同校验机制,实现了对拟南芥基因调控网络的高精度、规模化知识抽取与可视化管理。