OpenAc4C: A gateway to decode the landscape, regulation and pathogenesis of N4-acetylcytidine (ac4C) epitranscriptome
OpenAc4C 是首个专为解析跨物种 N4-乙酰胞苷(ac4C)表观转录组而构建的综合知识库,它整合了基于多种测序技术鉴定的数十万个 ac4C 位点及致病性变异数据,并通过友好的交互平台为研究 ac4C 的调控机制与疾病致病机理提供重要资源。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
OpenAc4C 是首个专为解析跨物种 N4-乙酰胞苷(ac4C)表观转录组而构建的综合知识库,它整合了基于多种测序技术鉴定的数十万个 ac4C 位点及致病性变异数据,并通过友好的交互平台为研究 ac4C 的调控机制与疾病致病机理提供重要资源。
本文介绍了专为长读长转录组数据设计的 VDJcraft 分析流程,该工具通过独特的双步比对与纠错策略,显著提升了 V(D)J 重组分析的准确性,不仅优于现有方法并发现新基因亚类,还成功揭示了 COVID-19 患者中独特的免疫重组特征。
本文提出了三种能够克服高度重复序列干扰的新型 k-mer 突变率估计器,并在 alpha 卫星序列等重复性数据上的实证测试中证明了其优越性。
本文提出了一种名为 GP-GHS 的贝叶斯节点回归框架,通过结合希尔伯特空间高斯过程与分组马蹄先验,从多重组织成像数据中高效推断出具有空间异质性的细胞 - 细胞相互作用网络,并在模拟与结直肠癌数据分析中展现出优越的性能与生物学发现能力。
本研究针对肝细胞癌(HCC)预后预测中分子异质性捕捉不足的问题,开发了一种基于注意力机制的可解释多分支深度学习框架,通过整合 mRNA、miRNA 和 DNA 甲基化等多组学数据,在 TCGA 和 GSE14520 队列中显著提升了生存预测性能,并成功识别出具有生物学意义的特征及候选生物标志物。
该研究通过引入基于 GPU 加速的 ProDive 算法,系统揭示了跨蛋白家族间短片段(8-13 个残基)的广泛复用现象,并证实这种复用主要源于蛋白质折叠早期结构形成这一共同的生物物理约束。
本文提出了一种名为 INAEME 的新型整合生物信息学分析流程,通过全面处理肿瘤 - 正常组织的 DNA 和 RNA 原始数据并纳入相位、转录本位置及移码等以往被忽视的突变事件,显著提高了癌症新抗原候选物的预测准确性,为癌症免疫治疗靶点或疫苗开发提供了更可靠的支持。
该研究提出了一种名为 STRAND 的简洁可解释回归模型,通过结合碱基配对对数几率等精细局部结构特征与全局指标,显著提升了 mRNA 溶液降解预测的准确性,其预测误差比现有机器学习方法降低了两倍以上。
本研究通过构建包含脆性 X 综合征及其等基因挽救系 iNeurons 的匹配多模态数据集,系统评估了不同长读长测序技术、定量工具及测序深度在体细胞与单细胞层面的表现,揭示了各平台在转录本长度检测上的偏差及工具优劣,并为实验设计与 FMR1 生物学研究提供了实用指南和基准数据。
本文介绍了 PanTEon,这是一个跨界的深度学习框架,通过整合自动策展的泛物种转座元件数据库与模块化基准测试平台,实现了转座元件分类的可重复性、标准化评估及可扩展性,从而揭示了不同分类器在跨物种泛化中的性能差异并推动了社区驱动的注释工作。