Discovery of TDP-43 aggregation inhibitors via a hybrid machine learning framework
该研究开发了一种结合图神经网络与 XGBoost 分类器的混合机器学习框架,成功筛选并实验验证了两种新型小分子化合物(berberrubine 和 PE859),它们能有效抑制 TDP-43 聚集并在秀丽隐杆线虫模型中改善运动缺陷,为神经退行性疾病的治疗提供了新候选药物。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究开发了一种结合图神经网络与 XGBoost 分类器的混合机器学习框架,成功筛选并实验验证了两种新型小分子化合物(berberrubine 和 PE859),它们能有效抑制 TDP-43 聚集并在秀丽隐杆线虫模型中改善运动缺陷,为神经退行性疾病的治疗提供了新候选药物。
本文提出了 CodonRL,一种结合演示引导强化学习与快速折叠反馈的多目标同义密码子序列优化框架,其在 55 种人类蛋白基准测试中显著优于现有最先进方法 GEMORNA,实现了更高的翻译效率、更优的 RNA 结构稳定性及更低的免疫原性。
该论文介绍了一个名为 TOXsiRNA 的免费网络服务器,它利用支持向量机等机器学习算法,基于单核苷酸组成等特征,能够高效预测化学修饰 siRNA 的毒性及其脱靶效应,从而辅助研究人员优化 siRNA 的设计与筛选。
该研究通过整合进化保守性和结构距离等五个关键特征,构建了一个基于机器学习的计算模型,能够准确预测结核分枝杆菌 Rv0678 基因变异对贝达喹啉表型的影响,从而辅助耐药结核病的治疗管理。
该研究开发了名为 miRarchitect 的机器学习驱动网络平台,通过整合神经网路指导的靶点选择、插入序列设计及骨架优化,实现了高效、特异性的人工 microRNA(amiRNA)理性设计,并经实验验证其显著优于现有工具。
本文提出了 Theseus,一种新颖且快速的算法,它利用基因组序列相似性和稀疏数据策略,在保持最优仿空位对齐的同时,显著降低了内存和计算开销,从而在多重序列比对和泛基因组读段映射任务中实现了优于现有最优及启发式方法的速度与性能。
该论文介绍了 evoCancerGPT,这是一种基于转移学习的生成式预训练 Transformer 单细胞基础模型,它利用 276 万个细胞令牌在伪时间序列上学习长程依赖关系,从而能够针对单个患者可靠地生成和预测癌症进化的零样本单细胞基因表达轨迹。
本文介绍了 ChatDIA,一种基于零样本大语言模型的自动化工作流,它通过显式推理框架直接分析数据非依赖性采集(DIA)质谱数据,在单细胞等复杂场景下实现了与顶尖专用软件(如 DIA-NN)相当的鉴定精度,同时提供了可解释的决策理由和自然语言交互能力。
本文提出了 LineageSim,一种能够模拟包含命运偏向性基因表达(即祖细胞状态携带后代终末命运潜在信号)的单细胞谱系生成框架,从而弥补了现有模拟器无法捕捉长程时间依赖性的缺陷,并为细胞命运预测算法提供了新的基准测试。
本文开发了 GeneReL 平台,通过结合大语言模型(LLM)的高效提取能力与社区驱动的协同校验机制,实现了对拟南芥基因调控网络的高精度、规模化知识抽取与可视化管理。