Suivi des Souches dans des Microbiomes Complexes en Utilisant l'Analyse de la Synténie Révèle des Modes d'Évolution par Espèce

Utilisation de l’Analyse de l’Ordre des Gènes pour la Traçabilité des Souches dans des Microbiomes Complexes Révèle des Modèles Évolutifs Spécifiques aux Espèces

Contexte

Les populations microbiennes se différencient en diverses souches par le biais de mutations ponctuelles de nucléotides et de variations structurelles (telles que la recombinaison, les insertions et les délétions). La plupart des méthodes de comparaison des souches quantifient principalement les différences de polymorphisme nucléotidique (SNPs), tout en négligeant les variations structurelles. Cependant, la recombinaison est un facteur important dans la diversification phénotypique de nombreuses espèces, y compris les pathogènes humains. Cet article présente un outil appelé SynTracker, qui utilise l’ordre des gènes (le séquençage des blocs de régions homologues dans le génome) pour comparer les souches microbiennes. L’ordre des gènes est une source riche d’informations génomiques qui n’est pas pleinement exploitée par les outils de comparaison des souches actuels. SynTracker a une faible sensibilité aux SNPs, n’a pas besoin de base de données et est robuste contre les erreurs de séquençage. Il surpasse les outils existants pour la traçabilité des souches dans les données métagénomiques, et est particulièrement adapté aux phages, plasmides et autres contextes de données limitées. Lorsqu’il est appliqué à des ensembles de données d’espèces uniques et au métagénome intestinal humain, SynTracker, combiné à des outils basés sur les SNPs, peut détecter des souches enrichies en mutations ponctuelles ou en variations structurelles, fournissant des aperçus sur l’évolution in situ des microbes.

Source de l’article

Cet article est principalement écrit par Hagay Enav, Inbal Paz et Ruth E. Ley, les auteurs sont affiliés au Max Planck Institute for Biology (Tübingen, Allemagne) et à l’Université de Tübingen (Tübingen, Allemagne). Cette recherche a été publiée dans le prestigieux journal « Nature Biotechnology », sous le numéro d’article https://doi.org/10.1038/s41587-024-02276-2.

Détail du processus de recherche

Aperçu du processus

  1. Identification des régions homologues :

    • Sélection d’un génome de référence et le diviser en régions centrales de 1-kpb.
    • Conversion du pool d’assemblage métagénomique spécifique à un échantillon en une base de données BLAST, en utilisant une recherche BLAST avec une grande précision pour ces régions centrales en tant que requête, avec un seuil d’identité minimal de 97%, et une couverture minimale de la requête de 70%.
    • Pour chaque hit BLAST, récupérez la région cible et ses 2 kpb voisins en amont et en aval, et collectez ces régions dans des boîtes spécifiques aux régions.
  2. Calcul des scores d’ordre spécifiques aux régions :

    • L’ensemble homologue de chaque région spécifique est attribué à une boîte régionale unique.
    • Dans chaque boîte, effectuer des comparaisons par paires afin d’identifier des blocs d’ordre et calculer un score d’ordre par paire spécifique à la région, basé sur le nombre de blocs d’ordre identifiés et le chevauchement entre les deux séquences.
  3. Calcul du score global (APSS) :

    • Pour chaque paire d’échantillons métagénomiques (ou de génomes), sélectionnez aléatoirement n régions pour comparer et calculer l’APSS en moyennant les scores d’ordre par paire de ces régions.

Principales expériences et résultats

  1. Tests de performance et de sensibilité :

    • Utilisation du logiciel BacMeta pour des simulations in silico, en introduisant deux types de mutations, seulement des SNPs et seulement des insertions/délétions, pour comparer les scores d’ordre des deux types de simulations.
    • Dans la simulation des SNPs, l’identité BLAST moyenne minimale de la région est de 99,5%, tandis que dans la simulation d’insertions/délétions, elle atteint 99,79%.
    • Les résultats montrent que, tout en introduisant des insertions/délétions, le score d’ordre des régions est significativement inférieur à celui des populations de SNPs.
  2. Classification des souches :

    • Analyse de 14 génomes d’Escherichia coli déjà classés, en sélectionnant aléatoirement 140 génomes pour une analyse et une construction d’un arbre phylogénétique.
    • Les résultats montrent que SynTracker peut reproduire le groupement phylogénétique publié avec seulement 2% d’échantillons génomiques.
  3. Établissement de seuils pour la traçabilité des souches :

    • Dans une étude longitudinale basée sur le microbiome intestinal humain, calculer l’APSS permettant la plus grande précision de classification des paires de souches, et utiliser ce standard pour analyser les modèles de localisation de différentes espèces.
    • Une observation a montré que la proportion de souches partagées entre la mère et l’enfant est plus élevée tôt dans la vie de l’enfant, et bien que le nombre total de partages de souches augmente avec l’âge de l’enfant, la proportion relative diminue.
  4. Haute sensibilité aux variations de structure génique :

    • En combinaison avec des outils de traçabilité des SNPs, analyse des échantillons de Neisseria gonorrhoeae, Escherichia coli résistante aux antibiotiques, Helicobacter pylori et Streptomyces rimosus.
    • Les résultats montrent que SynTracker a une haute sensibilité aux variations structurelles, tandis que les outils de SNPs sont plus sensibles aux mutations ponctuelles.

Principales conclusions et importance de l’étude

  • Valeur scientifique et applicative : SynTracker montre des avantages uniques dans l’analyse de l’évolution in situ des microbes. En combinant l’analyse de l’ordre des gènes et des SNPs, il révèle des modèles différents de différenciation des souches au sein des espèces. Ceci est significatif non seulement au niveau de la science fondamentale, mais fournit également de nouveaux outils et méthodes pour des recherches appliquées telles que la traçabilité des pathogènes, l’étude de la résistance aux antibiotiques et plus encore.

  • Points forts de la recherche :

    • Originalité : Introduction pour la première fois de la méthode de l’ordre des gènes, élargissant le cadre de comparaison des outils génomiques existants.
    • Haute efficacité et précision : Capable d’effectuer une classification et une traçabilité des souches efficaces avec une quantité minimale de fragments génomiques.
    • Large applicabilité : Adapté à des contextes de données limitées tels que les plasmides, les phages et la traçabilité des souches des espèces rares.

Autres informations pertinentes

  • Open source et partage des méthodes : SynTracker est disponible gratuitement en open source sur la plateforme GitHub, facilitant son utilisation et son amélioration par d’autres chercheurs.
  • Perspectives futures : En combinant des outils d’analyse de SNPs et de l’ordre des gènes, il est possible d’étudier plus en profondeur les mécanismes moléculaires de l’évolution des espèces spécifiques, révélant davantage les impacts des pressions environnementales et évolutives sur la diversité génomique des microbes.

Cette étude élargit non seulement notre compréhension des mécanismes évolutifs des populations microbiennes, mais fournit également un soutien considérable pour des applications pratiques. Les chercheurs peuvent utiliser ces outils pour traquer et étudier de manière plus précise la complexité et les dynamiques changeantes des microbiomes.