Polymorphismes de méthylation de l'ADN à l'échelle de la population à la résolution d'un seul nucléotide dans 207 accessions de coton révèlent les contributions épigénomiques aux traits complexes

Recherche sur la polymorphisme de la méthylation de l’ADN à l’échelle de la population de coton révèle la contribution épigénomique aux caractéristiques complexes

Contexte et motivations de la recherche

Au cours des dernières décennies, le génome et la diversité génétique ont été largement étudiés à travers des études d’association pangénomique (GWAS) qui ont permis de mieux comprendre la variation des caractéristiques des cultures. Cependant, le rôle des modifications épigénétiques, telles que la méthylation de l’ADN, dans la régulation des caractéristiques des cultures reste relativement méconnu. La méthylation de l’ADN est une marque épigénétique importante qui régule l’expression des gènes, stabilise le génome et joue un rôle clé dans plusieurs caractéristiques agronomiques des cultures. Des recherches ont démontré que la polymorphisme de la méthylation génomique est associée à l’adaptation écologique, mais l’apport de ces variations épigénétiques aux caractéristiques des cultures dans les populations naturelles reste à explorer.

Pour répondre à ce besoin, une équipe de chercheurs de l’université de Zhejiang et du groupe Alibaba a mené une étude systématique, générant des méthylomes, transcriptomes et génomes de haute qualité à partir de 207 accéssions de coton, étendant ainsi le cadre classique de la génétique des populations à l’épigénétique. Cette recherche a analysé la distribution de la méthylation de l’ADN dans différentes régions du génome, et a révélé les rôles régulateurs de la méthylation sur les caractéristiques des fibres de coton, fournissant ainsi des ressources épigénomiques précieuses pour l’amélioration des cultures. Cet article a été publié dans Cell Research en 2024.

Conception de l’étude et méthodes

Collecte d’échantillons et acquisition de données multi-omiques

Dans cette étude, les chercheurs ont cultivé 207 ressources de coton dans la ville de Hangzhou, en Chine, et ont prélevé des fibres 20 jours après l’anthèse (20-DPA) pour des analyses de séquençage de l’ADN par bisulfite (WGBS) et de l’ARN (RNA-seq). Cela a généré un total de 54 milliards de lectures pour le WGBS et 4,42 milliards pour le RNA-seq, fournissant une base de données étendue pour étudier la méthylation de l’ADN et l’expression des gènes dans les différentes variétés de coton.

En appliquant une stricte procédure de traitement et de contrôle de la qualité des données, les chercheurs ont identifié la présence de cytosines méthylées dans les contextes CG, CHG et CHH. En combinant les données de séquençage avec les informations génétiques des populations, l’équipe a été capable de caractériser l’impact de la méthylation sur les caractéristiques agronomiques des fibres de coton.

Analyse des caractéristiques de la méthylation du génome

Les résultats ont montré que le niveau de méthylation du génome du coton était de 72 % dans le contexte CG, de 55 % pour CHG, et de 11 % pour CHH. La distribution de la méthylation présentait une grande variabilité dans les régions riches en gènes. De plus, l’équipe a étendu le concept de déséquilibre de liaison (Linkage Disequilibrium, LD) aux sites de méthylation, définissant ainsi un “déséquilibre de méthylation” (Methylation Disequilibrium, MD). Les analyses ont montré que la méthylation au niveau des séquences CG et CHG tendait à se maintenir lors des divisions cellulaires, contrairement à la méthylation CHH.

Analyse de l’association entre la méthylation et l’expression des gènes

L’équipe a procédé à des analyses de QTL de méthylation cis (cis-meQTL) pour identifier les sites de méthylation (SMPs) qui influencent l’expression génique. Il a été démontré que plus de 36,39 % des gènes cis-eQTM ne présentaient aucune variation génétique associée, ce qui indique que de nombreux sites de méthylation influençant l’expression génique sont indépendants des polymorphismes nucléotidiques (SNPs).

En construisant un réseau d’association multi-omiques, les chercheurs ont également identifié des gènes clés impliqués dans le développement des fibres, tels que le gène codant pour la protéine kinase 10 (CIPK10) qui interagit avec CBL. La méthylation de ce gène était fortement corrélée avec la longueur des fibres, et cela a été validé expérimentalement par édition génique, présentant un potentiel pour l’amélioration du coton par la sélection de traits épigénomiques.

Principaux résultats de l’étude

Quantité de SMPs supérieure aux SNPs

Cette étude a révélé que le nombre de SMPs dans le génome du coton était 100 fois supérieur à celui des SNPs, ce qui suggère une plus grande variabilité de la méthylation de l’ADN par rapport aux variations génétiques dans les populations de coton. Les SMPs étaient enrichis dans les régions géniques, notamment les introns et les promoteurs, conformément à des observations précédentes chez Arabidopsis.

Impact de la polymorphisme de méthylation sur les caractéristiques des fibres

Grâce à des études d’association épigénomique (EWAS), 1715 loci épigénétiques ont été identifiés comme associés aux caractéristiques de rendement et de qualité des fibres. Il est intéressant de noter que seuls 2,10 % de ces loci se chevauchaient avec les loci identifiés par GWAS, indiquant que la méthylation de l’ADN pourrait être une source indépendante de variation des caractéristiques. Les analyses ont montré que la méthylation CG et CHG présentait un impact négatif sur l’expression des gènes situés dans la région des promoteurs proximaux.

Construction du réseau des gènes liés au développement des fibres

L’équipe de recherche a construit un réseau génique associé au développement des fibres de coton en intégrant les loci GWAS et EWAS. Ce réseau comprenait 634 connexions impliquant 397 gènes, dont plusieurs étaient déjà connus pour leur rôle dans l’élongation des fibres. En outre, un réseau de régulation épigénétique a été établi, révélant la complexité des mécanismes de régulation des caractéristiques des fibres.

Validation du gène CIPK10 par édition génique

En utilisant le système d’édition génique CRISPR/Cas9, l’équipe a réalisé des études de perte de fonction sur le gène CIPK10. Les résultats ont montré que l’inactivation de CIPK10 réduisait considérablement la longueur des fibres, confirmant ainsi son rôle essentiel dans le développement des fibres de coton. Ces résultats étendent notre compréhension du lien entre méthylation de l’ADN et caractéristiques agronomiques.

Modèle d’apprentissage profond pour prédire les loci de méthylation fonctionnels

Pour prédire les sites de méthylation fonctionnels, l’équipe a développé un modèle d’apprentissage profond, nommé DeepFDML (Deep Functional DNA Methylation Loci). Ce modèle a été formé sur des séquences génomiques et des caractéristiques moléculaires, utilisant un réseau de neurones convolutif et des couches Transformer. Le modèle présentait une courbe ROC (Receiver Operating Characteristic) de 0,82 et une précision de rappel (PRC) de 0,78, démontrant ainsi sa capacité à prédire efficacement les sites de méthylation fonctionnels.

Signification de la recherche et perspectives

L’analyse multi-omique réalisée dans cette étude a non seulement éclairé les mécanismes moléculaires qui gouvernent le développement des fibres de coton, mais a également étendu le cadre de la recherche sur le rôle des épigénomes dans la régulation des caractéristiques complexes. L’identification des SMPs comme source indépendante de variation des caractéristiques ouvre de nouvelles perspectives pour l’amélioration des cultures. De plus, le modèle DeepFDML présente une méthodologie prédictive prometteuse pour identifier des sites fonctionnels de méthylation dans d’autres espèces apparentées qui n’ont pas de données épigénomiques de grande échelle.

Conclusion

Cette étude fournit des ressources épigénomiques importantes pour l’amélioration de la qualité et du rendement des fibres de coton, et démontre le rôle indépendant de la méthylation de l’ADN dans la régulation des caractéristiques complexes des cultures. L’intégration de modèles d’apprentissage profond pour prédire les sites fonctionnels de méthylation pourrait améliorer la précision des prédictions dans l’amélioration génétique des cultures. Ces travaux montrent que la méthylation de l’ADN, en tant que couche de régulation supplémentaire, offre des opportunités pour améliorer et accélérer le.