Each language version is independently generated for its own context, not a direct translation.
这篇论文讲述了一个非常酷的故事:科学家如何利用超级人工智能(AI),在4800 万种化学分子组成的“大海”里,捞出了几颗能精准打击免疫系统的“珍珠”。
为了让你更容易理解,我们可以把整个过程想象成一场**“寻找特洛伊木马”的超级寻宝游戏**。
1. 难题:一扇没有锁孔的“铁门”
想象一下,人体里有一个叫 CD28 的免疫受体,它就像一扇守卫森严的铁门。这扇门负责给免疫细胞(T 细胞)发信号,告诉它们“该去战斗了”。
- 传统难题:通常,我们要锁住一扇门,得找一个深深的“锁孔”(结合口袋),把钥匙插进去。但 CD28 这扇门表面非常平坦,像一块光滑的平板,上面根本没有明显的“锁孔”。
- 后果:以前的药物很难找到地方下手,就像你想把钥匙插进一块光滑的石头表面一样,几乎不可能。
2. 策略:AI 侦探与“大海捞针”
既然没有现成的锁孔,科学家决定换个思路:在门旁边的微小缝隙里找机会。
- 巨大的图书馆:他们有一个包含 4800 万种 不同化学分子的巨大图书馆(Enamine REAL 数据库)。要在这么多书里找到能塞进那个微小缝隙的“钥匙”,靠人眼翻找是不可能的,那得花几百年。
- AI 侦探登场:于是,他们请出了 PyRMD2Dock 这个 AI 侦探。
- 第一步(试错):AI 先随机挑了 240 万 个分子,像做实验一样,把它们一个个“扔”进那个微小缝隙里,看看谁卡得最紧。
- 第二步(学习):AI 观察了这些“试错”的结果,学会了什么样的分子形状能卡住。它就像个天才学生,看了一遍就记住了规律。
- 第三步(预测):学会规律后,AI 不需要再一个个去试剩下的 4600 万 个分子了。它直接在大脑里“算”出哪些分子最有可能卡住。这就像侦探看了一页线索,就能瞬间推断出整本侦探小说的结局。
3. 筛选:从 4800 万到 150 的“漏斗”
AI 跑完程序后,从 4800 万分子里挑出了 232 个 最有希望的候选者。
- 科学家把这 232 个分子买回来(其中 150 个),在实验室里进行真正的“面试”。
- 面试结果:太棒了!这 150 个分子里,有 12 个 真的能紧紧抓住 CD28 这扇门。命中率高达 7.3%(通常这种大海捞针的命中率只有千分之一甚至更低)。
4. 明星选手:100 号和 104 号
在通过面试的分子中,有两个明星选手脱颖而出:化合物 100 和 化合物 104。
- 它们有多强? 它们对 CD28 的抓握力非常强(亲和力达到亚微摩尔级别),就像强力胶水一样。
- 它们做了什么?
- 物理阻断:它们卡在那个微小缝隙里,挡住了 CD28 和它的搭档(CD80)握手。
- 切断信号:因为手被挡住了,免疫细胞收不到“去战斗”的信号,于是它们就冷静下来了。
- 细胞实验:在模拟人体环境的复杂模型(比如肿瘤细胞和免疫细胞混在一起)中,这两个分子成功减少了炎症因子的分泌,就像给发疯的免疫系统按下了“暂停键”。
5. 为什么这很重要?
这就好比以前我们面对这种“平坦”的免疫受体,就像面对一堵没有门的墙,束手无策。
- 以前的方法:要么放弃,要么花几十年慢慢试。
- 现在的方法:利用 AI + 超大规模筛选,我们不仅能找到入口,还能在几天内从几千万种可能中找到完美的“钥匙”。
总结
这篇论文证明了:AI 不再是科幻,它是真实的药物发现加速器。
通过这种“先让 AI 在虚拟世界里模拟几千万次,再在现实世界里验证”的方法,科学家成功攻克了以前被认为“无法下手”的免疫靶点。这为未来治疗自身免疫疾病(如类风湿关节炎、红斑狼疮)甚至癌症(通过调节免疫反应)打开了新的大门。
一句话概括:科学家利用 AI 在 4800 万种分子中,精准找到了两把能锁住“免疫大门”的钥匙,成功让过激的免疫系统冷静下来。
Each language version is independently generated for its own context, not a direct translation.
这是一份关于利用人工智能辅助的超大规模虚拟筛选发现 CD28 强效结合剂的论文详细技术总结。
1. 研究背景与问题 (Problem)
- 蛋白质 - 蛋白质相互作用 (PPI) 靶点挑战:利用小分子靶向 PPI 在历史上极具挑战性,因为 PPI 界面通常平坦、溶剂暴露且缺乏经典的深结合口袋(如酶或受体的正交位点)。
- CD28 靶点的特殊性:CD28 是一种共刺激免疫受体,其与配体 CD80/CD86 的结合界面主要是平面的 β-折叠表面,缺乏深凹陷,使得传统基于结构的药物设计(SBVS)难以找到有效的结合位点。
- 计算瓶颈:在超大规模化学空间(数十亿化合物)中应用传统的 SBVS 流程面临巨大的计算资源瓶颈,难以高效筛选出新颖的化学骨架。
2. 方法论 (Methodology)
本研究首次将 PyRMD2Dock 平台(集成在 PyRMD Studio 套件中)应用于现实世界的药物发现,结合了机器学习(ML)和标准分子对接。
- 工作流程设计:
- 初始筛选与训练集构建:从 Enamine REAL Diversity Space 数据库中随机选取 240 万 个化学多样性分子。
- 分子对接:使用 AutoDock-GPU (AD4-GPU) 将这些分子对接到 CD28 晶体结构(PDB ID: 1YJD)中。
- 结合位点选择:由于天然配体结合位点(MYPPPY 基序)过于平坦,研究团队根据 CTLA-4 的结构同源性分析,选定了一个相邻的、由 H38, F93, K95, D106, N107, K109, S110 等残基定义的潜在口袋作为靶点。
- 机器学习模型训练:
- 基于对接得分(ΔGAD4)将化合物分类为“活性”和“非活性”。
- 通过调整活性/非活性的阈值(ϵ cutoffs),训练了 672 个 不同的分类模型。
- 采用 Butina 聚类 和 StratifiedGroupKFold 交叉验证策略,防止数据泄露,确保模型泛化能力。
- 最终选定的最佳模型参数为:活性阈值 -7.75 kcal/mol,非活性阈值 -4.75 kcal/mol。
- 超大规模虚拟筛选:利用优化后的 PyRMD 模型,对剩余的 ~4600 万 个化合物进行快速筛选(无需对每个分子进行显式对接)。
- 多级过滤与聚类:
- 筛选出约 2000 万个预测活性分子,进一步通过严格的对接能量截断(≤−7.75 kcal/mol)筛选至 ~20 万。
- 应用基于关键残基(K109 和 C94)的相互作用过滤。
- 进行溶剂可及表面积(SASA)分析和结构聚类,最终选出 232 个高优先级配体。
- 实验验证:购买并测试了其中 150 个化合物。
3. 关键贡献 (Key Contributions)
- 首次前瞻性应用:这是 PyRMD2Dock 平台首次在现实世界中进行前瞻性应用,验证了 AI 增强型 SBVS 流程在超大规模化学空间中的可行性。
- 解决浅口袋难题:成功在 CD28 这种缺乏深结合口袋的“难成药”免疫受体上发现了高亲和力的小分子结合剂。
- 高效筛选策略:证明了结合 ML 分类器与 GPU 加速对接的混合策略,可以显著加速超大规模库的筛选(速度提升约 3.3 倍),同时保持高命中率。
- 双重结合模式发现:计算分析揭示了活性化合物(如 100 和 104)在靶点口袋中可能采取两种不同的结合取向,为后续先导化合物优化提供了重要指导。
4. 主要结果 (Results)
- 筛选命中率:在购买的 150 个化合物中,Dianthus 初筛发现了 12 个 阳性 hits(命中率约 7.3%)。
- 结合亲和力 (MST):
- 化合物 100 和 104 表现出亚微摩尔级的亲和力,解离常数 (Kd) 分别为 343.8 nM 和 407.1 nM。
- 其他化合物(如 24, 68)也显示出低微摩尔级的结合能力。
- 功能阻断 (ELISA):
- 化合物 100 和 104 能有效竞争性阻断 CD28-CD80 相互作用,IC50 分别为 231.4 nM 和 840.6 nM。
- 结合亲和力与功能阻断活性之间存在良好的相关性。
- 细胞信号阻断:
- 在 Jurkat 细胞报告基因实验中,100 和 104 成功抑制了 CD28 介导的信号传导,IC50 分别为 748.9 nM 和 1.13 μM。
- 生理相关模型验证:
- 肿瘤-PBMC 共培养模型:100 和 104 显著降低了 IFN-γ、IL-2 和可溶性 CD69 的分泌,表明其能有效抑制 T 细胞激活。
- 人 PBMC-气道组织共培养模型:化合物 100 在模拟粘膜免疫微环境的系统中,同样表现出剂量依赖性的细胞因子分泌抑制作用。
- 结合模式分析:
- 化合物 100(Cluster 3)和 104(Cluster 1)虽然属于不同簇,但均与关键残基(如 H38, K95, K109, K2, D106)形成关键的氢键、阳离子-π 或卤素键相互作用。
5. 意义与结论 (Significance)
- 验证 AI 驱动的药物发现范式:该研究有力地证明了 AI 驱动的超大规模虚拟筛选可以成功解锁结构上极具挑战性的免疫受体界面,为靶向复杂 PPI 提供了可扩展且高效的范式。
- CD28 抑制剂的新进展:发现了具有亚微摩尔亲和力的全新化学骨架 CD28 拮抗剂(100 和 104),这些分子在复杂的生理相关模型中表现出显著的免疫调节活性,具有转化为治疗药物的潜力。
- 技术平台推广:PyRMD Studio 套件(特别是 PyRMD2Dock)被证明是挖掘海量化学库、发现难成药靶点小分子调节剂的强大工具, democratizes(民主化)了复杂的 AI 药物筛选流程,使非编码专家也能进行高级虚拟筛选。
总结:这项研究通过创新的"AI 增强型 SBVS"策略,克服了 CD28 靶点平坦界面的筛选难题,从 4800 万化合物库中成功发现了高活性先导化合物,并经过多层级生物实验验证了其功能,展示了计算化学与实验生物学紧密结合在免疫药物发现中的巨大潜力。