tensorOmics: Data integration for longitudinal omics data using tensor factorisation
本文介绍了一个名为 tensorOmics 的 R 语言计算框架,该框架通过张量分解技术,能够同时整合多组学数据并保留纵向研究中的时间维度结构,从而实现对生物系统随时间变化的协同分子响应的监督式与非监督式分析。
1250 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了一个名为 tensorOmics 的 R 语言计算框架,该框架通过张量分解技术,能够同时整合多组学数据并保留纵向研究中的时间维度结构,从而实现对生物系统随时间变化的协同分子响应的监督式与非监督式分析。
本文提出了 SpaDecoder,这是一种基于并行矩阵分解的细胞类型解卷积方法,通过自适应推断的 3D 高斯核有效利用了组织的三维结构和单细胞参考图谱,从而实现了对多个空间或时间转录组切片中细胞比例的精准估算。
本文开发了一种名为 miRXplain 的可解释性深度学习模型,通过利用 CLIP-L 实验数据和混合注意力 Transformer 架构,实现了对异构 miRNA(isomiR)及其靶标相互作用的高精度预测,并揭示了不同 miRNA 变体在靶向选择上的序列特征。
本文通过构建一个考虑分类学差异且匹配内在无序度的基准测试框架,揭示了现有蛋白质相分离预测器存在的偏差,并为开发更具泛化能力的预测模型提供了更公平、更具解释性的评估方法。
本研究通过结合蛋白质语言模型(PLM)与生物物理参数,提出了一种预测抗体非特异性结合的方法,证明了重链变量区及等电点是关键预测因子,为优化抗体药物的可开发性提供了新思路。
本研究表明,吸烟通过诱导肠道菌群失调、改变代谢产物并抑制包括CPT2在内的抑癌基因,从而促进结直肠癌的发生与发展。
该研究通过网络算法探索已知致病基因的功能邻域,并结合全球视角分析基因与蛋白质家族的行为,提出了一种基因-疾病特异性评分方法,旨在通过优化基因优先级排序来提升罕见病的新诊断效率。
PlantMDCS 是一个无需编程、模块化的植物多组学数据库构建系统,通过解耦的前后端架构实现了本地化部署,能够快速、安全地完成从数据管理到集成分析的全流程工作流。
本文通过结合反向折叠、结构预测及局部挫折分析,发现蛋白质中某些进化保守的“挫折热点”即使不利于结构稳定性也无法被消除,并据此提出这些位点如同“建筑学上的拱肋(spandrels)”一般,是由物理约束产生并随后被进化利用于功能的。
本研究通过液相色谱-高分辨质谱(LC-HRMS)结合定制的R语言数据分析流程,实现了一种无需培养的策略,成功鉴定出三种海绵微生物组中包含Ferricrocin等59种潜在的铁载体分子。