Minimal Amino Acid Alphabet for Protein Design
该研究通过生物信息学调查与计算设计发现,尽管自然界中极少存在由少于 10 种氨基酸组成的蛋白质,但利用精简氨基酸库(特别是 8 种氨基酸)成功设计出具有复杂折叠结构的球蛋白,并验证了其在进化起源及合成生物学应用中的潜力。
1248 篇论文
生物信息学宛如一座连接生物学与计算机科学的桥梁,利用强大的算法和数据分析技术,将海量的生命遗传信息转化为可理解的科学发现。这一领域不再依赖显微镜下的观察,而是通过代码挖掘基因组的秘密,帮助科学家理解疾病机制、追踪病毒变异并推动精准医疗的发展。
作为 Gist.Science 的专属栏目,我们持续追踪来自 bioRxiv 的最新预印本论文,确保您能第一时间接触前沿动态。团队对每一篇新上传的预印本进行深度处理,不仅提供详尽的技术总结,更精心撰写通俗易懂的科普解读,让复杂的生物数据变得清晰易懂。
以下为您呈现该领域最新发表的几项重要研究成果,带您探索生命数字化的最新进展。
该研究通过生物信息学调查与计算设计发现,尽管自然界中极少存在由少于 10 种氨基酸组成的蛋白质,但利用精简氨基酸库(特别是 8 种氨基酸)成功设计出具有复杂折叠结构的球蛋白,并验证了其在进化起源及合成生物学应用中的潜力。
本文介绍了 CLAMP,一种通过两阶段算法设计、内部交叉验证及内存映射技术,在保持生物特异性的同时显著提升计算效率并克服内存限制的可扩展半监督潜在变量分析方法,从而填补了现代大规模转录组数据中生物先验知识整合的空白。
本文介绍了 GraTools,一款基于原始 GFA 文件、支持高效并行处理与多格式输出的用户友好型命令行工具,旨在解决泛基因组变异图(PVGs)分析中缺乏集成与效率的问题,从而促进从群体遗传学到育种及基因组医学等领域的下游研究。
该研究利用机器学习集成模型分析太空飞行小鼠视网膜数据,揭示了氧化脂质过氧化与细胞凋亡是两种分子机制截然不同的视网膜损伤通路,为开发宇航员视觉健康监测的生物标志物和治疗靶点提供了理论框架。
该研究表明,通过引入嵌套结构和隐状态扩展 TKF92 模型,仅需 3.2 万个参数的基于分子进化理论的嵌套出生 - 死亡过程模型,在蛋白质演化建模的竞争力和参数效率上可与拥有数千万参数的神经序列到序列模型相媲美,甚至优于大多数无约束的神经网络架构。
本文介绍了 CAPHEINE,这是一个跨平台(Mac OS、Windows、Linux)的自动化计算工作流,能够从非比对病原体序列和参考基因组出发,执行全面的探索性进化分析,特别适用于研究位点选择动态、基因水平正选择及谱系特异性选择压力变化。
本文提出了名为 AlphaCell 的生成式虚拟细胞世界模型,通过整合全基因组表征、高保真重构及基于最优传输条件流匹配的通用状态转移机制,实现了在未见细胞情境下对扰动诱导细胞动态的零样本预测与泛化模拟。
本文提出了一种名为 PAMG-AT 的层次化图神经网络模型,通过结合知识驱动的生理关系图、空间注意力机制与时间 Transformer 架构,在 WESAD 数据集上实现了高精度且具备可解释性的多模态可穿戴设备压力检测。
本文提出了 InertialGenome,一种基于惯性系姿态归一化和几何感知位置编码的分辨率无关 Transformer 框架,用于解决单细胞 Hi-C 数据中染色体 3D 结构重建的泛化性难题,并在多分辨率重建精度、功能验证及跨分辨率迁移学习方面均优于现有基线方法。
本文介绍了 SCOTCH,这是一种支持多种长读长单细胞测序平台的端到端分析流程,通过建模非重叠子外显子、动态阈值判定及迭代聚类策略,显著提升了单细胞水平上已知转录本的定量精度和新型异构体的重建能力。