La métagénomique fonctionnelle basée sur les séquences révèle une nouvelle diversité naturelle du gène de résistance au cuivre copa dans les microbiomes environnementaux
La métagénomique fonctionnelle basée sur les séquences révèle une nouvelle diversité naturelle des gènes COPA fonctionnels dans les microbiomes environnementaux
La diversité naturelle des gènes/protéines fonctionnels dans les microbiomes environnementaux est une composante importante de la recherche en évolution et en bio-ingénierie. Afin d’approfondir notre compréhension de la diversité du gène de résistance au cuivre (Cu) COPA dans les microbes globaux, cette étude a adopté une approche de métagénomique fonctionnelle basée sur les séquences. Cette recherche a non seulement combiné les techniques d’assemblage métagénomique, de BLAST local, d’analyse des traces évolutives (ETA), de synthèse chimique et de génomique fonctionnelle traditionnelle, mais a également réussi à exploiter efficacement la diversité des gènes COPA dans l’ADN environnemental (eDNA).
Contexte de la recherche
Le processus d’évolution microbienne a produit une diversité de gènes/protéines fonctionnels, qui ont des applications étendues dans des domaines tels que la phylogénie microbienne et l’ingénierie des protéines. Par exemple, des gènes tels que la sous-unité bêta de l’ARN polymérase dirigée par l’ADN (RPB) et la protéine fer de la nitrogénase (NIFH) sont largement utilisés pour identifier et décrire la “matière noire” non cultivable. Les protéines fonctionnelles connues existantes ne représentent qu’une petite fraction des protéines produites par le processus de sélection naturelle. La récupération à haut débit de la diversité des variantes naturelles de protéines fonctionnelles aide à révéler les différences entre les protéines naturelles existantes et les séquences aléatoires, et fournit une base pour l’ingénierie des protéines basée sur des bibliothèques de variantes de séquences à grande échelle issues de la sélection naturelle.
Cependant, pour certains gènes/protéines fonctionnels, tels que les gènes de résistance aux métaux, leur diversité naturelle reste difficile à explorer en raison de leur faible abondance dans l’environnement et du manque de séquences caractérisées dans les bases de données courantes. Les données métagénomiques contiennent toutes les informations génétiques de l’ADN environnemental, offrant une voie idéale pour explorer la diversité naturelle de ces gènes/protéines. Traditionnellement, la détection des gènes fonctionnels reposait sur l’exploration génomique de cultures pures. La métagénomique basée sur les séquences transcende les limites des méthodes de criblage fonctionnel et d’isolement redondant.
Source de l’étude
Cet article a été réalisé conjointement par Wenjun Li, Likun Wang, Xiaofang Li, Xin Zheng, Michael F. Cohen et Yong-Xin Liu, provenant respectivement de l’Institut de génétique et de biologie du développement de l’Académie chinoise des sciences, du Laboratoire clé d’écologie des sols de la province du Hebei, de l’Université d’État de Sonoma aux États-Unis et du Laboratoire national clé de génomique des plantes de l’Académie chinoise des sciences. Cette étude a été publiée dans la revue “Genomics Proteomics & Bioinformatics” en 2023.
Introduction au processus de recherche
1. Collecte et traitement des données
87 ensembles de données métagénomiques représentant divers microbiomes environnementaux mondiaux ont été collectés à partir de bases de données publiques. Le serveur MG-RAST a été utilisé pour assembler ces métagénomes et effectuer un contrôle qualité, assurant l’intégrité et la précision des données. Ces données métagénomiques ont ensuite été soumises à un BLAST local pour la recherche de séquences de gènes COPA.
2. Recherche et analyse des gènes COPA
Par le biais d’une recherche BLAST sur tous les métagénomes assemblés, 93 899 hits ont été obtenus, dont 1 214 hits de haute confiance ont été sélectionnés manuellement, aboutissant finalement à 517 séquences candidates COPA uniques. Ces séquences ont ensuite été soumises à une analyse ETA, qui a permis de sélectionner 175 nouvelles séquences COPA de haute qualité. Ensuite, une analyse phylogénétique a été utilisée pour examiner la relation évolutive entre ces séquences et les protéines COPA connues.
3. Expériences de validation fonctionnelle
Dix nouveaux gènes COPA ont été synthétisés chimiquement et exprimés de manière hétérologue dans Escherichia coli (ΔcopA) sensible au Cu. Des tests de croissance et des mesures d’absorption du Cu ont montré que cinq de ces nouveaux clones avaient un impact positif sur la résistance au Cu et son absorption par l’hôte. L’un des recombinants, COPA-like 15 (copal15), a réussi à restaurer la résistance au Cu de l’hôte et à augmenter significativement sa capacité d’absorption du Cu. Deux autres nouveaux gènes COPA ont été fusionnés avec le gène GFP et observés au microscope dans E. coli, montrant qu’ils étaient correctement exprimés et localisés sur la membrane cellulaire.
Résultats de la recherche
Caractéristiques structurelles de l’ETA et des protéines COPA
L’analyse ETA a montré que les 34 protéines COPA connues proviennent principalement de 14 espèces bactériennes, presque toutes les protéines COPA connues fonctionnant pour l’efflux du Cu, à l’exception du COPA d’E. hirae annoté comme une P-type ATPase d’absorption du cuivre. En termes de longueur de protéine, COPA contient généralement environ 800 acides aminés, la plus longue provenant de Yersinia pestis avec 961 acides aminés. Parmi les 14 groupes de COPA, le nombre de domaines ATPase de transport des métaux lourds (HMA) varie de 1 à 3, mais le COPA du genre Legionella pneumophila ne possède pas de domaine HMA. Toutes les protéines COPA ont un domaine E1-E2 ATPase, qui est associé à l’hydrolyse de l’ATP et à la liaison et l’efflux du Cu par des changements conformationnels.
Nouveaux gènes COPA divers dans les microbiomes globaux
À partir de 88 ensembles de données métagénomiques, plus de 5,5 millions de contigs et 134 millions de séquences d’acides aminés ont été utilisés pour le BLAST local, et l’analyse a finalement été effectuée dans 87 bases de données. Au total, 93 899 hits ont été obtenus, dont 517 séquences ont été sélectionnées manuellement, allant de 500 à 900 acides aminés, dont 315 séquences avec des hélices transmembranaires, 222 séquences contenant un domaine ATPase de transport des métaux lourds, et finalement 175 gènes similaires à COPA ont été sélectionnés. Selon la classification Kraken 2, ces gènes sont principalement répartis dans cinq phyla : Proteobacteria, Actinobacteria, Euryarchaeota, Bacteroidetes et Firmicutes, dont 55 séquences proviennent d’espèces totalement inconnues.
Validation fonctionnelle
Dix gènes candidats COPA ont été choisis au hasard parmi les 175 pour une synthèse chimique et exprimés dans E. coli ΔcopA. Les tests de croissance et d’absorption du Cu ont montré que cinq de ces nouveaux gènes COPA amélioraient significativement la résistance au Cu et la capacité d’absorption de l’hôte. En particulier, COPA-like 6 a inhibé significativement la croissance de l’hôte, mais sa capacité d’absorption du Cu a également été significativement améliorée.
Conclusions de l’étude
Cette étude a considérablement élargi la diversité connue des protéines COPA et a développé une méthode de métagénomique fonctionnelle à haut débit basée sur les séquences, surmontant les biais de longueur, de criblage et d’abondance des gènes de résistance dans les méthodes traditionnelles. L’étude démontre la diversité des gènes COPA dans de nouvelles espèces et leurs différents mécanismes de résistance, fournissant des ressources précieuses pour l’ingénierie future des protéines et la recherche sur l’évolution des gènes de résistance aux métaux.
Points saillants de la recherche
- Méthode efficace de traitement des données : Développement et application d’une méthode efficace de métagénomique fonctionnelle basée sur les séquences pour explorer et analyser les gènes fonctionnels dans les microbiomes environnementaux à l’échelle mondiale.
- Révélation de la diversité : Mise en évidence de la grande diversité des gènes COPA dans les microbiomes environnementaux, découverte de nouvelles séquences COPA provenant de diverses espèces inconnues.
- Validation fonctionnelle : Validation de la fonction des nouveaux gènes COPA découverts par expression hétérologue, démontrant le potentiel des nouveaux gènes COPA dans l’amélioration de la résistance au cuivre et de son absorption.
Valeur et signification
Cette recherche a non seulement une valeur scientifique importante pour comprendre la diversité naturelle de la résistance aux métaux chez les microbes, mais elle fournit également de nouvelles ressources génétiques et des méthodes pour de futures applications en bioremédiation et en bio-ingénierie. De plus, la méthode de cette étude offre une approche technique hautement faisable et efficace pour l’exploitation fonctionnelle des données métagénomiques, avec de larges perspectives d’application.