STRmie-HD enables interruption-aware HTT repeat genotyping and somatic mosaicism profiling across sequencing platforms
该研究提出了 STRmie-HD 这一无需比对的分析框架,能够跨测序平台实现亨廷顿舞蹈症 HTT 基因 CAG 重复序列的精确分型、突变中断模式识别及单读长分辨率的体细胞嵌合体定量分析。
1243 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究提出了 STRmie-HD 这一无需比对的分析框架,能够跨测序平台实现亨廷顿舞蹈症 HTT 基因 CAG 重复序列的精确分型、突变中断模式识别及单读长分辨率的体细胞嵌合体定量分析。
EvoRMD 是一种整合了大规模 RNA 语言模型上下文嵌入与结构化生物元数据(如物种、细胞类型等)的统一模型,通过多类分类框架和可解释的注意力机制,实现了对多种 RNA 修饰类型的精准预测与生物学洞察。
本文报道了一种基于生成式扩散模型和分子动力学模拟的全计算流程,成功从头设计并验证了一种靶向 SpCas9 非催化表位的高亲和力 VHH 纳米抗体,该纳米抗体可作为双价枢纽架构招募效应分子,从而增强 CRISPR-Cas9 系统的功能。
本研究通过基准测试四种生成式 AI 工具(RFdiffusion、BindCraft、PepMLM 和 RFpeptides),成功设计出针对软骨再生关键靶点 BMPR1A 的高亲和力候选肽,并确立了包含物理能量评分与接触复现度评估的可重复计算框架,为后续实验验证提供了优选分子。
本文提出了名为 SelectZyme 的嵌入引导框架,通过整合蛋白质语言模型、降维及层次聚类技术,实现了无需依赖固定序列阈值或预定义功能标注的酶序列空间结构化导航,从而在稀疏标注条件下有效支持酶发现与下游蛋白质工程。
本文介绍了 CBIcall,这是一个基于配置的开源框架,旨在通过单一 YAML 文件标准化并自动化从原始测序数据到变异检测结果的流程,从而解决大规模多中心基因组研究中因软件环境差异导致的流程不一致和结果不可复现问题。
该研究介绍了开源工具 Isopedia,它通过构建基于证据权重的参考无关剪接异构体注释框架,利用大规模长读长数据有效区分随机噪声与生物活性异构体,从而显著降低了转录组研究中的“新发现”虚高问题并推动了人类转录组的系统性解读。
该研究表明,在肌萎缩侧索硬化症(ALS)与对照组的分类任务中,基于混合格式生活方式问卷的紧凑纵向变化描述特征比单纯的静态文本衍生特征具有更优的预测价值,其核心优势在于捕捉纵向轨迹而非单纯扩充静态特征空间。
该研究开发了名为 ORPHEUS 的分析方法,通过量化细胞间表达方差中的 12 小时节律特征来解耦细胞振荡幅度与时间相干性,从而揭示阿尔茨海默病患者兴奋性神经元中存在显著的细胞间昼夜节律失同步现象。
该研究提出了一种名为 CoMPLip 的免训练方法,通过在 AlphaFold 3 预测过程中将膜蛋白与脂质分子共折叠以显式构建膜环境,显著提升了膜蛋白结构预测的准确性,包括配体姿态预测、跨膜结构域分离及多构象态采样。