使用等变三维条件扩散模型进行分子连接设计
从事早期药物发现的科研人员面临着一个巨大挑战,即在大约10的60次方种可能的分子结构中寻找具有药理活性的候选分子。一种成功的解决方案是从较小的”片段”分子着手,这种策略被称为基于片段的药物设计(FBDD)。在FBDD过程中,首先需要利用计算机筛选出与目标蛋白口袋结合的片段,然后再将这些片段连接成单个化合物。连接片段时,需要考虑片段的几何构象以及蛋白质口袋的结构,以设计出高亲和力的潜在药物分子。
这篇论文介绍了一种名为DiffLinker的新型分子线酶(linker)设计方法。它是一种三维Equivariant Diffusion模型,能够给定任意数量的断开的片段,生成连接这些片段的线酶结构。与之前的基于自回归的方法不同,DiffLinker能一次性生成连接两个或更多片段的线酶,无需预先确定线酶原子数或连接位点。此外,该模型还能结合目标蛋白的口袋信息,生成能有效与之结合的分子。
该文由伊利亚·伊加绍夫等人撰写,第一作者来自瑞士联邦理工学院lausanne分校,合作者还包括麻省理工学院、微软人工智能研究院、牛津大学的科研人员。该研究成果于2024年4月发表在自然杂志《Nature Machine Intelligence》上。
研究人员首先在ZINC、CASF等公开数据集上训练并评估了DiffLinker模型。实验结果表明,与其他线酶设计方法相比,DiffLinker生成的分子具有更高的合成可访问性、更好的成药性、更高的化学多样性,而且能较好地重现参考分子结构。
接下来,研究人员提出了一个新的更具挑战性的Geom数据集,其中每个样例包含3个或更多待连接的片段。在此数据集上,DiffLinker展现出优异表现,93%的生成分子是有效的,而其他方法几乎无法生成有效分子。
在条件设置中,研究人员让DiffLinker结合目标蛋白的口袋原子云,生成能与蛋白质口袋构象相容的线酶结构。与仅基于片段生成分子的方法相比,经口袋条件约束的DiffLinker生成的分子扭曲构象更少,预测结合亲和力更高。
最后,研究人员通过三个真实案例(HSP90抑制剂、IMPDH抑制剂和JNK抑制剂的设计)阐释了DiffLinker在药物设计中的实际应用。结果表明,DiffLinker能成功重现文献报道的已知活性分子,并生成具有更好理化性质和结合性的新分子。
该研究为基于片段的药物设计提供了一种新的高效工具。DiffLinker能更快、更准确地设计连接不同片段的结构,并自动确定线酶原子数和连接位点,避免了需要人工设计的复杂过程。此外,结合蛋白口袋信息进行条件生成,能为FBDD策略提供更具指导意义的候选分子。总的来说,DiffLinker展现出极大的应用前景,有望加速新药物的发现和开发。