利用AlphaFold高通量发现抑制性蛋白质片段的研究

高精度预测蛋白片段抑制活性的新方法:FragFold的应用

学术背景

蛋白质相互作用在细胞生命活动中扮演着至关重要的角色,而小肽(peptides)或蛋白片段(protein fragments)可以通过与特定蛋白界面结合,调节蛋白功能,甚至作为抑制剂发挥作用。近年来,高通量实验技术的发展使得在活细胞中大规模测量蛋白片段的抑制活性成为可能。然而,迄今为止,尚未有相应的计算方法能够预测哪些蛋白片段能够与目标蛋白结合并发挥抑制作用,更不用说预测它们的结合模式。这一领域的研究空白促使研究人员开发新的计算工具来解决这一问题。

AlphaFold的推出为蛋白质结构预测带来了革命性的突破,但其在预测蛋白片段与全蛋白结合方面的应用仍然有限。为了填补这一空白,Andrew Savinov等研究人员开发了一种名为FragFold的计算方法,旨在利用AlphaFold的高通量预测能力,大规模预测蛋白片段的结合模式及其抑制活性。

论文来源

这篇论文由Andrew Savinov、Sebastian Swanson、Amy E. Keating和Gene-Wei Li共同撰写,他们分别来自麻省理工学院(MIT)的生物学系、生物工程系和Koch癌症研究中心。该研究于2025年2月3日发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences, PNAS)上,论文题目为“High-throughput discovery of inhibitory protein fragments with AlphaFold”。

研究流程

1. FragFold方法的开发

FragFold的核心是利用AlphaFold2的单体模型权重,通过ColabFold平台进行蛋白片段与全蛋白结合的高通量预测。为了避免在模型训练过程中记住天然的蛋白结合数据,研究人员选择了仅基于单链数据进行训练的AlphaFold2单体模型。为了加速多序列比对(MSA)的生成,研究人员对传统的MSA生成步骤进行了优化,通过预先生成全蛋白的MSA,并对其进行修剪,生成每个片段对应的MSA。这些MSA随后被输入AlphaFold2,生成蛋白片段与目标蛋白的结合模型。

FragFold的创新之处在于,它没有仅仅依赖AlphaFold的置信度指标(如pLDDT和ipTM),而是重点关注了AlphaFold生成的结构模型中的结合接触点(n_contacts),并结合ipTM分数进行加权,生成预测结合峰值。通过这种方式,FragFold能够更准确地预测蛋白片段的结合模式。

2. 在已知蛋白界面上的应用

研究人员首先将FragFold应用于已知的蛋白-蛋白相互作用界面,特别是E. coli中的FtsZ蛋白。FtsZ是一种与细胞分裂相关的结构蛋白,其聚合界面的多个区域已被实验证明具有抑制活性。FragFold成功预测了与这些抑制活性峰对应的结合峰,并且预测的结合模式与实验确定的天然结合模式高度一致。特别是,FragFold预测的结合模式在四个主要抑制峰(1、1’、2、2’)中均表现出与晶体结构相似的空间构象,RMSD(均方根偏差)均小于3 Å。

3. 在多种蛋白上的应用

为了验证FragFold的普适性,研究人员将其应用于多种结构和功能各异的蛋白,包括50S核糖体亚基蛋白L7/L12、DNA旋转酶亚基A(GyrA)、单链DNA结合蛋白(SSB)等。在这些蛋白上,FragFold同样表现出较高的预测准确性,成功预测了87%的已知蛋白界面抑制片段的结合模式。例如,L7/L12蛋白的二聚化域片段被预测与L7/L12结合,其RMSD为1.2 Å,与天然结合模式的相似度达到93%。

4. 预测未知结合模式

FragFold的另一个重要应用是预测未知的蛋白片段结合模式。研究人员将FragFold应用于FtsZ蛋白的C端无序尾巴(intrinsically disordered tail),该区域在晶体结构中没有被解析,但已知在细胞分裂过程中与FtsA、MinC和ZipA等蛋白相互作用。FragFold成功预测了FtsZ C端片段与这些蛋白的结合模式,并与已有的遗传和生化数据高度一致。例如,FragFold预测FtsZ C端片段能够结合到FtsZ的GTPase活性位点,阻止其与临近FtsZ单体的T7环结合,这一预测与分子动力学模拟的结果一致。

5. 深度突变扫描验证

为了进一步验证FragFold预测的结合模式,研究人员对多个抑制片段进行了深度突变扫描(deep mutational scanning)。通过对每个片段的每个残基进行突变,并在活细胞中测量其抑制活性的变化,研究人员发现,FragFold预测的关键结合残基在突变后表现出显著的抑制活性变化。例如,FtsZ片段中某些残基的突变导致其抑制活性大幅下降,而另一些残基的突变则增强了其抑制活性。这些实验结果进一步支持了FragFold预测的结合模式的准确性。

主要结果与结论

FragFold成功预测了多个蛋白片段的结合模式及其抑制活性,特别是在已知的蛋白-蛋白相互作用界面上,其预测的准确率达到了87%。此外,FragFold还能够预测未知的结合模式,例如FtsZ C端无序尾巴与FtsA、MinC和ZipA的相互作用。这些预测不仅与已有的遗传和生化数据一致,还为这些蛋白的调控机制提供了新的分子模型。

深度突变扫描实验进一步验证了FragFold预测的准确性,揭示了蛋白片段中关键残基对其抑制功能的重要作用。这些实验结果不仅支持了FragFold的预测能力,还为设计更高效的蛋白抑制剂提供了重要的实验依据。

研究的意义与价值

FragFold的开发为大规模发现蛋白片段抑制剂提供了强大的计算工具。通过结合AlphaFold的高精度结构预测能力和高通量实验数据,FragFold能够准确预测蛋白片段的结合模式及其抑制活性。这一方法不仅能够帮助研究人员深入理解蛋白片段的功能机制,还为药物开发提供了新的思路。例如,通过预测和筛选具有抑制活性的蛋白片段,FragFold可以加速新型肽类药物的开发进程。

此外,FragFold的自动化预测流程也为未来的蛋白质组学(proteomics)研究提供了新的工具。通过系统地扫描全蛋白质组中的功能性蛋白片段,FragFold有潜力揭示更多的蛋白相互作用网络,并为细胞生命活动的调控机制提供新的见解。

研究亮点

  1. 高准确性:FragFold在已知蛋白界面上的预测准确率达到87%,并能够预测未知的结合模式。
  2. 自动化流程:FragFold通过自动化预测流程,能够高效地扫描全蛋白质组中的抑制片段。
  3. 实验验证:深度突变扫描实验进一步验证了FragFold的预测结果,揭示了关键残基的功能作用。
  4. 广泛应用:FragFold不仅能够应用于已知的蛋白界面,还能够预测无序蛋白区域的结合模式,为蛋白质功能研究提供了新的工具。

FragFold的开发标志着蛋白质片段预测领域的重要进展,为未来的研究和应用提供了广阔的前景。