Découverte à haut débit de fragments de protéines inhibitrices avec AlphaFold
Nouvelle méthode de haute précision pour prédire l’activité inhibitrice des fragments de protéines : l’application de FragFold
Contexte académique
Les interactions protéiques jouent un rôle crucial dans les activités de la vie cellulaire, et les petits peptides ou fragments de protéines peuvent réguler la fonction des protéines en se liant à des interfaces spécifiques, voire agir comme inhibiteurs. Ces dernières années, le développement de techniques expérimentales à haut débit a permis de mesurer à grande échelle l’activité inhibitrice des fragments de protéines dans les cellules vivantes. Cependant, jusqu’à présent, il n’existait aucune méthode informatique capable de prédire quels fragments de protéines pourraient se lier aux protéines cibles et exercer une activité inhibitrice, encore moins de prédire leurs modes de liaison. Cette lacune dans la recherche a incité les chercheurs à développer de nouveaux outils informatiques pour résoudre ce problème.
L’introduction d’AlphaFold a révolutionné la prédiction de structures protéiques, mais son application pour prédire la liaison entre des fragments de protéines et des protéines complètes restait limitée. Pour combler cette lacune, Andrew Savinov et ses collègues ont développé une méthode informatique appelée FragFold, visant à utiliser les capacités de prédiction à haut débit d’AlphaFold pour prédire à grande échelle les modes de liaison et l’activité inhibitrice des fragments de protéines.
Source de l’article
Cet article a été coécrit par Andrew Savinov, Sebastian Swanson, Amy E. Keating et Gene-Wei Li, tous affiliés au Massachusetts Institute of Technology (MIT) dans les départements de biologie, d’ingénierie biologique et du Koch Institute for Integrative Cancer Research. La recherche a été publiée le 3 février 2025 dans Proceedings of the National Academy of Sciences (PNAS), sous le titre « High-throughput discovery of inhibitory protein fragments with AlphaFold ».
Processus de recherche
1. Développement de la méthode FragFold
Le cœur de FragFold repose sur l’utilisation des poids monomères d’AlphaFold2 via la plateforme ColabFold pour effectuer des prédictions à haut débit de la liaison entre les fragments de protéines et les protéines complètes. Pour éviter que le modèle ne retienne les données de liaison naturelles lors de l’entraînement, les chercheurs ont choisi la version monomère d’AlphaFold2, qui est entraînée uniquement sur des données de chaînes uniques. Afin d’accélérer la génération des alignements multiples de séquences (MSA), les chercheurs ont optimisé les étapes traditionnelles de génération de MSA en pré-générant les MSA complets des protéines et en les taillant pour générer les MSA correspondant à chaque fragment. Ces MSA ont ensuite été introduits dans AlphaFold2 pour générer des modèles de liaison entre les fragments de protéines et les protéines cibles.
L’innovation de FragFold réside dans le fait qu’il ne se base pas uniquement sur les indicateurs de confiance d’AlphaFold (comme pLDDT et ipTM), mais se concentre plutôt sur les points de contact de liaison (n_contacts) dans les modèles structuraux générés par AlphaFold, en les pondérant par le score ipTM, générant ainsi des pics de liaison prédits. Grâce à cette approche, FragFold peut prédire plus précisément les modes de liaison des fragments de protéines.
2. Application aux interfaces de protéines connues
Les chercheurs ont d’abord appliqué FragFold aux interfaces de protéines-protéines connues, notamment la protéine FtsZ d’Escherichia coli. FtsZ est une protéine structurale impliquée dans la division cellulaire, dont plusieurs régions de l’interface de polymérisation ont été expérimentalement prouvées avoir une activité inhibitrice. FragFold a réussi à prédire des pics de liaison correspondant à ces pics d’activité inhibitrice, et les modes de liaison prédits étaient très similaires aux modes de liaison natifs déterminés expérimentalement. En particulier, les modes de liaison prédits par FragFold dans les quatre principaux pics d’inhibition (1, 1’, 2, 2’) présentaient des conformations spatiales similaires aux structures cristallines, avec des RMSD (racine carrée de l’écart quadratique moyen) inférieurs à 3 Å.
3. Application à diverses protéines
Pour vérifier la généralité de FragFold, les chercheurs l’ont appliquée à diverses protéines ayant des structures et des fonctions différentes, y compris la protéine L7/L12 du sous-unité 50S du ribosome, la sous-unité A de la gyrase ADN (GyrA), la protéine de liaison à l’ADN simple brin (SSB), etc. Sur ces protéines, FragFold a également montré une précision élevée dans les prédictions, réussissant à prédire les modes de liaison de 87% des fragments inhibiteurs d’interfaces de protéines connues. Par exemple, le domaine de dimérisation du fragment de la protéine L7/L12 a été prédit pour se lier à L7/L12, avec un RMSD de 1,2 Å et une similarité avec le mode de liaison natif de 93%.
4. Prédiction de modes de liaison inconnus
Une autre application importante de FragFold est la prédiction de modes de liaison inconnus. Les chercheurs ont appliqué FragFold à la queue désordonnée C-terminale (intrinsically disordered tail) de FtsZ, une région non résolue dans les structures cristallines mais connue pour interagir avec des protéines telles que FtsA, MinC et ZipA pendant la division cellulaire. FragFold a réussi à prédire les modes de liaison entre les fragments C-terminaux de FtsZ et ces protéines, en accord avec les données génétiques et biochimiques existantes. Par exemple, FragFold a prédit que les fragments C-terminaux de FtsZ pouvaient se lier au site actif GTPase de FtsZ, empêchant sa liaison avec la boucle T7 du monomère adjacent de FtsZ, une prédiction confirmée par les simulations de dynamique moléculaire.
5. Validation par balayage mutagénique profond
Pour valider davantage les modes de liaison prédits par FragFold, les chercheurs ont effectué des balayages mutagéniques profonds (deep mutational scanning) sur plusieurs fragments inhibiteurs. En mutuant chaque résidu de chaque fragment et en mesurant les changements d’activité inhibitrice dans les cellules vivantes, ils ont constaté que les résidus clés de liaison prédits par FragFold montraient des changements significatifs d’activité inhibitrice après mutation. Par exemple, certaines mutations dans les fragments de FtsZ ont conduit à une baisse drastique de leur activité inhibitrice, tandis que d’autres ont renforcé cette activité. Ces résultats expérimentaux soutiennent davantage l’exactitude des modes de liaison prédits par FragFold.
Principaux résultats et conclusions
FragFold a réussi à prédire les modes de liaison et l’activité inhibitrice de nombreux fragments de protéines, en atteignant une précision de 87% pour les interfaces de protéines-protéines connues. De plus, FragFold a pu prédire des modes de liaison inconnus, tels que les interactions entre la queue désordonnée C-terminale de FtsZ et FtsA, MinC et ZipA. Ces prédictions sont non seulement en accord avec les données génétiques et biochimiques existantes, mais fournissent également de nouveaux modèles moléculaires pour le mécanisme de régulation de ces protéines.
Les expériences de balayage mutagénique profond ont davantage validé l’exactitude des prédictions de FragFold, révélant l’importance des résidus clés pour la fonction inhibitrice des fragments de protéines. Ces résultats expérimentaux non seulement soutiennent la capacité de prédiction de FragFold, mais fournissent également des bases expérimentales importantes pour la conception d’inhibiteurs peptidiques plus efficaces.
Signification et valeur de la recherche
Le développement de FragFold fournit un outil informatique puissant pour découvrir à grande échelle des inhibiteurs de fragments de protéines. En combinant les capacités de prédiction structurale de haute précision d’AlphaFold et les données expérimentales à haut débit, FragFold peut prédire précisément les modes de liaison et l’activité inhibitrice des fragments de protéines. Cette méthode permet non seulement aux chercheurs de mieux comprendre les mécanismes fonctionnels des fragments de protéines, mais ouvre également de nouvelles perspectives pour le développement de médicaments. Par exemple, en prédiction et en sélection de fragments de protéines ayant une activité inhibitrice, FragFold peut accélérer le processus de développement de nouveaux médicaments peptidiques.
De plus, le flux de travail automatisé de FragFold offre de nouveaux outils pour les futures recherches en protéomique. En balayant systématiquement les fragments fonctionnels de l’ensemble du protéome, FragFold a le potentiel de révéler de nouveaux réseaux d’interactions protéiques et d’offrir de nouvelles perspectives sur les mécanismes de régulation des activités cellulaires.
Points forts de la recherche
- Haute précision : FragFold atteint une précision de 87% dans les prédictions d’interfaces de protéines connues et peut prédire des modes de liaison inconnus.
- Processus automatisé : FragFold utilise un flux de travail automatisé pour scanner efficacement les fragments inhibiteurs dans tout le protéome.
- Validation expérimentale : Le balayage mutagénique profond a validé davantage les résultats des prédictions de FragFold, révélant les rôles fonctionnels des résidus clés.
- Large application : FragFold peut être appliqué non seulement aux interfaces de protéines connues, mais aussi pour prédire les modes de liaison dans les régions désordonnées des protéines, offrant de nouveaux outils pour l’étude des fonctions protéiques.
Le développement de FragFold marque une avancée importante dans le domaine de la prédiction des fragments de protéines, ouvrant de vastes perspectives pour les futures recherches et applications.