A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization
该论文提出了一种基于时序卷积网络(TCN)的多标签深度学习框架,通过同时预测多个转录因子在 DNA 序列上的结合位点,有效捕捉了转录因子间的协同调控机制并揭示了具有生物学意义的共结合模式。
29 篇论文
该论文提出了一种基于时序卷积网络(TCN)的多标签深度学习框架,通过同时预测多个转录因子在 DNA 序列上的结合位点,有效捕捉了转录因子间的协同调控机制并揭示了具有生物学意义的共结合模式。
该论文提出了 ScNucAdapt 方法,利用部分域适应技术有效解决了 scRNA-seq 与 snRNA-seq 数据间的分布差异,实现了跨模态单细胞数据中鲁棒且准确的细胞类型注释。
本文介绍了 DeeDeeExperiment,这是一个基于 Bioconductor 生态系统的新型 S4 类,旨在通过扩展 SingleCellExperiment 对象并引入专门的差异表达和功能富集分析结果存储槽,来解决多组学实验结果缺乏标准化数据结构的问题,从而实现分析结果的统一管理、可重复性提升及高效共享。
该研究利用 openSNP 数据集中的 80 种二元表型,系统评估了 29 种机器学习算法、80 种深度学习算法及 3 种多基因风险评分工具的性能,发现机器学习在 44 种表型上表现更优,而多基因风险评分工具在 36 种表型上更具优势,从而为不同表型下的预测方法选择提供了重要参考。
该研究提出了一种结合机器学习和深度学习的流程,通过分析 openSNP 数据中的基因型来分类病例与对照并计算特征重要性,成功利用表现最佳的模型识别出与表型相关的基因,其基因识别率平均达到 0.84,为疾病机制研究和治疗靶点发现提供了有力支持。
SeekRBP 是一种结合序列与结构信息、利用强化学习中的多臂老虎机策略动态优化负样本采样的框架,旨在解决受体结合蛋白(RBP)识别中因序列高度变异和类别不平衡导致的传统方法失效问题。
该研究通过荧光偏振竞争结合实验精确测定了转录因子 Klf4 的体外结合能,并证明结合线性模型与伊辛模型(Ising model)的统计力学框架,能够仅凭体外数据准确预测 Klf4 在单分子及全基因组范围内的结合占据情况。
该研究通过引入因果电路追踪方法,揭示了 Geneformer 和 scGPT 等单细胞基础模型具有高度保守的抑制主导计算架构与生物一致性,并验证了跨模型共识域与疾病及基因调控的显著关联。
该研究提出了一种结合可解释机器学习与实验验证的数据驱动方法,通过功能导向的降维技术,将复杂的微生物群落简化为少数关键功能组,从而揭示了从肠道到土壤等不同生态系统中微生物群落功能与结构之间的映射关系及其应对扰动的分子机制。