Détermination des structures des conformères d'ARN utilisant la microscopie à force atomique et les réseaux de neurones profonds
Contexte académique
L’ARN (acide ribonucléique) est une molécule cruciale dans les organismes vivants, impliquée dans l’expression génique, la régulation et la catalyse de divers processus biologiques. Bien qu’une grande partie du génome humain soit transcrit en ARN, l’étude des structures des molécules d’ARN reste un défi majeur. Les molécules d’ARN présentent généralement une hétérogénéité conformationnelle et une flexibilité élevées, ce qui est essentiel pour leur fonction, mais cela limite également l’application des méthodes traditionnelles de détermination structurelle, telles que la résonance magnétique nucléaire (RMN), la cristallographie aux rayons X et la cryo-microscopie électronique (cryo-EM). En particulier, pour les ARN de grande taille, en raison de leur diversité conformationnelle et du manque de bases de données structurelles à grande échelle, les méthodes actuelles de prédiction de structure des protéines (comme AlphaFold) ne peuvent pas être directement appliquées à l’ARN. Par conséquent, la détermination précise des structures tridimensionnelles des ARN de grande taille, en particulier leur hétérogénéité conformationnelle, constitue un problème majeur en biologie structurale de l’ARN.
Origine de l’article
Cet article a été rédigé par Maximilia F. S. Degenhardt, Hermann F. Degenhardt, Yuba R. Bhandari et d’autres scientifiques issus de plusieurs institutions, notamment le National Cancer Institute et le National Institute of Diabetes and Digestive and Kidney Diseases. L’article a été publié en 2024 dans la revue Nature sous le titre Determining structures of RNA conformers using AFM and deep neural networks.
Processus de recherche
1. Objectifs et méthodes générales
L’étude propose une nouvelle méthode appelée HORNET, qui combine la microscopie à force atomique (AFM), l’apprentissage automatique non supervisé et les réseaux de neurones profonds (DNN) pour déterminer les structures topologiques tridimensionnelles des molécules d’ARN. La méthode HORNET repose sur l’utilisation des images AFM pour capturer des informations topologiques à haute résolution sur des molécules d’ARN individuelles en solution, puis sur l’analyse de ces informations à l’aide d’algorithmes d’apprentissage automatique et d’apprentissage profond pour reconstruire les structures tridimensionnelles de l’ARN.
2. Processus expérimental
a) Acquisition et traitement des images AFM
L’étude commence par l’utilisation de l’AFM pour imager les molécules d’ARN, obtenant des images topologiques à haute résolution de molécules d’ARN individuelles. L’AFM présente l’avantage d’un rapport signal/bruit élevé, permettant de capturer les caractéristiques structurelles des ARN de grande taille dans différentes conformations. Les chercheurs ont estimé le bruit et analysé la résolution des images AFM pour s’assurer que leur qualité était suffisante pour la reconstruction structurelle ultérieure.
b) Ajustement dynamique et génération de modèles
Les chercheurs ont utilisé des simulations de dynamique moléculaire à grains grossiers (coarse-grained molecular dynamics) pour ajuster dynamiquement les molécules d’ARN, générant un grand nombre de modèles conformationnels. Ces modèles sont contraints par les informations topologiques des images AFM, garantissant que les modèles générés sont cohérents avec les données expérimentales. Lors de l’ajustement dynamique, les chercheurs ont introduit un pseudo-potentiel AFM et une description classique de l’énergie libre de Gibbs pour conduire les modèles vers une convergence avec les données expérimentales.
c) Apprentissage automatique non supervisé (UML) et sélection des modèles
Sur la base des modèles générés par l’ajustement dynamique, les chercheurs ont utilisé l’apprentissage automatique non supervisé (UML) pour regrouper et sélectionner ces modèles. L’algorithme UML combine des informations énergétiques, des informations topologiques AFM et les principes de repliement hiérarchique de l’ARN pour sélectionner les modèles les plus conformes aux données expérimentales. Grâce à l’analyse en composantes principales (PCA) et à des algorithmes de clustering, les chercheurs ont sélectionné parmi un grand nombre de modèles ceux présentant les énergies les plus basses et correspondant le mieux aux images AFM.
d) Réseaux de neurones profonds (DNN) et estimation de la précision
Pour améliorer encore la précision des modèles, les chercheurs ont développé un réseau de neurones profond (DNN) pour estimer l’écart quadratique moyen (RMSD) entre chaque modèle et la structure réelle. Le DNN est entraîné sur une base de données contenant 3,5 millions de modèles de structures d’ARN (PSDatabase), ce qui lui permet de prédire avec précision la précision des modèles. Le processus d’entraînement et de validation du DNN montre que cette méthode peut estimer efficacement la précision des structures d’ARN inconnues, en particulier lorsque le RMSD est inférieur à 7 Å.
e) Validation et application
Les chercheurs ont appliqué la méthode HORNET à plusieurs molécules d’ARN, notamment l’ARN de la RNase P et l’élément de réponse Rev (RRE) du VIH-1. Grâce aux images AFM et à la méthode HORNET, les chercheurs ont réussi à déterminer les structures de plusieurs conformères de ces ARN, démontrant la puissance de cette méthode pour résoudre l’hétérogénéité conformationnelle des ARN de grande taille.
Résultats principaux
Images AFM et reconstruction structurelle : Les chercheurs ont capturé avec succès plusieurs conformations de l’ARN de la RNase P et de l’ARN RRE du VIH-1 à l’aide de l’AFM, et ont reconstruit les structures tridimensionnelles de ces ARN grâce à la méthode HORNET. Les structures reconstruites présentent un RMSD de 3 à 6 Å par rapport aux structures cristallines connues, ce qui montre que la méthode HORNET peut déterminer avec précision les structures topologiques de l’ARN.
Efficacité de l’apprentissage automatique non supervisé : Grâce à l’apprentissage automatique non supervisé, les chercheurs ont sélectionné parmi un grand nombre de modèles générés par ajustement dynamique ceux qui correspondaient le mieux aux données expérimentales. Ces modèles présentent un RMSD d’environ 5 Å, ce qui montre que l’algorithme UML peut sélectionner efficacement des modèles structurels de haute qualité.
Estimation de la précision par les réseaux de neurones profonds : Le DNN peut estimer avec précision le RMSD entre chaque modèle et la structure réelle, en particulier lorsque le RMSD est inférieur à 7 Å. Les prédictions du DNN sont en accord étroit avec les modèles sélectionnés par l’UML, ce qui valide davantage la fiabilité de la méthode HORNET.
Détermination de la structure de l’ARN RRE du VIH-1 : Les chercheurs ont déterminé avec succès plusieurs conformations de l’ARN RRE du VIH-1 et ont constaté que les distances entre les sites de liaison de la protéine Rev variaient considérablement entre ces conformations. Cette découverte apporte un nouvel éclairage sur la manière dont le virus VIH-1 reconnaît spécifiquement l’ARN RRE.
Conclusions et implications
La méthode HORNET, en combinant l’AFM, l’apprentissage automatique non supervisé et les réseaux de neurones profonds, a résolu avec succès le problème de la détermination de l’hétérogénéité conformationnelle des ARN de grande taille. Cette méthode permet non seulement de capturer des informations topologiques à haute résolution sur les molécules d’ARN, mais aussi de reconstruire avec précision leurs structures tridimensionnelles grâce à des algorithmes d’apprentissage automatique. La proposition de la méthode HORNET fournit un nouvel outil pour la recherche en biologie structurale de l’ARN et pourrait accélérer notre compréhension de l’espace conformationnel de l’ARN, en particulier dans les domaines de la fonction de l’ARN et de la conception de médicaments ciblant l’ARN.
Points forts de la recherche
- Méthode innovante : La méthode HORNET est la première à combiner l’AFM, l’apprentissage automatique non supervisé et les réseaux de neurones profonds pour déterminer les structures tridimensionnelles de l’ARN, comblant ainsi une lacune dans le domaine de la détermination des structures de l’ARN.
- Reconstruction structurelle de haute précision : Grâce à la méthode HORNET, les chercheurs peuvent reconstruire avec une grande précision les structures topologiques de l’ARN, avec un RMSD de 3 à 6 Å, démontrant la puissance de cette méthode dans la détermination des structures de l’ARN.
- Perspectives d’application étendues : La méthode HORNET est non seulement applicable à la détermination des structures des ARN connus, mais peut également être utilisée pour prédire les structures des ARN inconnus, offrant ainsi un nouvel outil pour la recherche sur la fonction de l’ARN et la conception de médicaments.
Autres informations utiles
Les chercheurs ont également conçu un nouveau peptide ramifié, mimant la structure dimérique de la protéine Rev du VIH-1, et ont démontré sa capacité à se lier avec une haute spécificité à l’ARN RRE. Cette découverte ouvre de nouvelles perspectives pour le développement de nouveaux médicaments anti-VIH.