Interpretable and predictive models based on high-dimensional data in ecology and evolution
该研究通过模拟实验评估了九种统计方法在高维生态与进化数据中的表现,指出尽管过拟合普遍存在且准确变量选择在现实采样方案中往往难以实现,但在样本量充足、效应显著且变量较少时,稀疏模型仍能在保证预测精度的同时缓解过拟合问题。
269 篇论文
基因组学探索着生命最底层的密码,致力于解读决定生物性状的遗传蓝图。这一领域不再局限于实验室,而是正深刻影响着我们对疾病、进化乃至人类自身起源的理解。在 Gist.Science 的基因组学版块中,我们专注于呈现来自 bioRxiv 的最新预印本,确保您能第一时间接触到科学界最前沿的未经同行评审的原始发现。
我们的团队会即时处理 bioRxiv 发布的每一篇相关预印本,将其转化为通俗易懂的科普摘要与详尽的技术解读,帮助不同背景的读者跨越专业壁垒。无论您是寻求灵感的科研工作者,还是对生命奥秘充满好奇的探索者,这里都能为您提供清晰、及时的资讯。
以下是该领域最新发布的论文列表,邀请您一同开启这场解读生命密码的探索之旅。
该研究通过模拟实验评估了九种统计方法在高维生态与进化数据中的表现,指出尽管过拟合普遍存在且准确变量选择在现实采样方案中往往难以实现,但在样本量充足、效应显著且变量较少时,稀疏模型仍能在保证预测精度的同时缓解过拟合问题。
该研究利用 PacBio HiFi 长读长测序技术,成功对来自冈比亚的 43 株恶性疟原虫培养物进行了从头组装,生成了包含完整变体表面抗原(VSA)基因家族的高精度染色体水平基因组,为深入理解疟原虫进化、传播动态及抗原多样性提供了宝贵资源。
本文提出了 ARGformer,这是一种基于 Transformer 的自监督学习模型,它利用从祖先重组图(ARG)中提取的嵌入表示,在不依赖基因型矩阵的情况下有效捕捉全球种群结构并实现精准的祖先推断。
本文提出了 BioWorldModel,这是一种统一的基因组预测架构,通过进化课程学习在单一参数下跨真菌、植物和动物三个界别成功预测了多种性状表型分布,其性能显著优于传统单物种模型。
本文介绍了一种名为 ExTRaCT 的自动化基因搜索流程,该工具无需依赖全基因组注释或近缘物种知识,即可高效、准确地从新测序的蝙蝠基因组中识别并分类具有保守结构的 APOBEC3 Z 结构域基因。
该研究利用增强型体内 Perturb-seq 技术,对小鼠大脑中 1,947 个疾病相关基因进行敲除并分析了超过 770 万个细胞的转录组响应,构建了首个全脑范围的基因功能图谱,揭示了疾病基因在不同细胞类型中的特异性功能及其对神经发育和精神疾病机制的调控作用。
该研究通过对 62 份挪威传统“克维克”(Kveik)酵母菌株的全基因组测序与系统发育分析,证实了这些酵母是早期驯化的古老谱系,代表了距今 4000 至 8000 年前农业传播时期形成的独特且濒危的遗传资源。
该研究分析了 4694 个真核生物基因组,发现编码分泌信号的基因普遍富集于具有较长侧翼基因间区且富含截断重复序列的基因组区域,揭示了这种保守的基因组架构可能通过重复序列驱动的拷贝数变异等机制推动了分泌蛋白功能的进化创新。
该研究利用杂交猪群,系统解析了遗传因素与热应激环境对猪全血基因表达水平的相对影响,鉴定了数千个差异表达基因和表达数量性状位点,并揭示了与热调节及生产性状相关的候选基因。
该研究利用大规模并行报告基因检测(MPRA)系统性地揭示了转录因子结合的位置依赖性及其与局部序列的协同作用,表明变异在调控序列中的位置会显著改变其效应幅度,从而凸显了基因组调控中上下文环境的重要性。