Correlate: A Web Application for Analyzing Gene Sets and Exploring Gene Dependencies Using CRISPR Screen Data
本文介绍了 Correlate,一款无需安装登录即可在浏览器中运行的免费网络应用,它通过分析超过 1000 种人类癌细胞系的 CRISPR 筛选数据,直接基于功能表型而非先验知识来探索基因依赖关系、分析基因集并辅助实验设计。
1235 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
本文介绍了 Correlate,一款无需安装登录即可在浏览器中运行的免费网络应用,它通过分析超过 1000 种人类癌细胞系的 CRISPR 筛选数据,直接基于功能表型而非先验知识来探索基因依赖关系、分析基因集并辅助实验设计。
该研究开发了 snoFlake 网络模型,揭示了 snoRNA 与 RNA 结合蛋白的非经典相互作用,并发现 SNORD22 通过与 U5 snRNP 组分结合来增强弱剪接位点的识别,从而调控可变剪接。
本研究采用整合计算策略,针对轮状病毒 VP4 基因保守区设计并筛选出一种在结构兼容性和与 RISC 加载蛋白相互作用稳定性方面表现优异的 siRNA 候选分子,为开发抗轮状病毒疗法奠定了理性计算基础。
该论文提出了一种名为 Nettle 的新方法,通过插补肽段保留时间边界而非直接插补缺失的定量值,显著提高了数据非依赖性采集(DIA)蛋白质组学中的定量准确性并降低了检测下限。
本文介绍了 PlantCAD2,这是一个在 65 个被子植物基因组上预训练的专用 DNA 基础模型,它凭借 8,192bp 的长上下文窗口和高效参数设计,在进化保守性捕捉及跨物种基因组功能预测任务中表现优于现有大型模型,为植物基因组注释提供了强大且通用的工具。
本文介绍了 PathogenSurveillance,这是一个基于 Nextflow 的开源自动化流程,旨在通过整合短读长和长读长测序数据、自动检索参考基因组并生成交互式报告,实现对原核及真核病原体的快速、标准化种群基因组分析与鉴定,从而支持实时生物监测与应急响应。
CellWHISPER 是一种能够克服空间结构干扰、实现严格误差控制且计算可扩展的统计框架,它从单细胞分辨率空间转录组数据中精准推断直接接触介导的细胞间通讯(如间隙连接和配体 - 受体机制),并成功揭示了阿尔茨海默病模型中特定的细胞通讯重编程模式。
本文提出了 seq2ribo,这是一种结合结构感知模拟与机器学习的混合框架,能够仅凭 mRNA 序列即可高精度预测核糖体位置分布及蛋白表达水平,从而为无需表达数据的 mRNA 疫苗等合成生物学应用提供了新的设计工具。
该研究提出了动态一致性指数(DCI)以量化跨细胞类型中基因时间轨迹的规律性,并据此筛选高可预测基因,结合不确定性感知的循环神经网络模型,显著提升了创伤后跨细胞类型单细胞时序基因表达预测的准确性与可靠性。
该论文提出了 GATSBI 框架,通过整合多源生物数据构建上下文感知的蛋白质嵌入,并采用与具体生物任务对齐的数据划分策略进行训练与评估,从而显著提升了模型在相互作用预测、功能注释及功能模块发现等任务中的泛化能力,特别是在针对研究不足的蛋白质和归纳式节点划分场景下表现优异。