Paysages de répétition du génome entier dans le cancer et l'ADN circulant

La vue panoramique des séquences répétées du génome entier dans le cancer et l’ADN libre

Aperçu de l’étude

Contexte et signification de l’étude

Pendant le développement du cancer et d’autres maladies, les variations génétiques des séquences répétées dans le génome sont une caractéristique importante. Cependant, les méthodes de séquençage standard ne permettent pas de représenter efficacement ces séquences répétées. Pour relever ce défi, cette étude a développé une nouvelle méthode appelée Artemis (Analysis of Repeat Elements in Disease) pour identifier les éléments répétés dans le séquençage du génome entier. En analysant des échantillons de tissus et de plasma de patients atteints de divers types de cancer, l’objectif est d’explorer les variations spécifiques de ces éléments répétés et d’évaluer leur potentiel pour la détection précoce du cancer et la surveillance des maladies.

Source de l’article

Cette étude a été réalisée par Akshaya V. Annapragada, Noushin Niknafs, James R. White et al., affiliés au Centre intégré contre le cancer Sidney Kimmel et au Département de médecine de la Faculté de médecine de l’Université Johns Hopkins. Les résultats ont été publiés dans le journal “Science Translational Medicine” le 13 mars 2024, sous le numéro d’article eadj9283.

Processus de l’étude

Aperçu du processus général

Le processus général de cette étude comprend le développement de la méthode Artemis, la collecte et le traitement des données, l’identification des éléments répétés, la modélisation par apprentissage automatique, la validation des résultats et l’évaluation de l’application clinique. Les sujets de l’étude couvrent 2837 échantillons de tissus et de plasma de 1975 patients, incluant divers types de cancer tels que le cancer du poumon, du sein, et colorectal.

Collecte et traitement des données

L’étude s’est d’abord basée sur une nouvelle méthode de recherche de kmer pour identifier de nouveaux kmers (courtes séquences) sur la base du génome de référence complet T2T (chm13), découvrant un total de 1,2 milliard de kmers de 24 pb. Ces kmers ont été utilisés pour définir 1280 types d’éléments répétés, incluant les éléments longs dispersés (LINEs), les éléments courts dispersés (SINEs), les séquences répétées terminales longues (LTRs), les éléments transposables, et la famille des satellites humains.

Identification et analyse des éléments répétés

En utilisant la méthode Artemis, l’étude a analysé les variations spécifiques de ces éléments répétés dans différents types de cancer, découvrant que 820 de ces éléments montraient pour la première fois des variations dans le cancer. De plus, les éléments répétés sont enrichis dans les régions des gènes promoteurs, ces variations étant liées à des changements structurels du génome et à l’état épigénétique.

Établissement du modèle d’apprentissage automatique

Grâce à l’analyse par apprentissage automatique du paysage répétitif du génome entier et des profils de fragmentation de l’ADN libre (cfDNA), l’étude a développé un modèle de prédiction capable de détecter le cancer du poumon et du foie à un stade précoce. Ce modèle a montré une grande précision lors de la validation croisée et de la validation externe, et permet d’identifier de manière non invasive le tissu d’origine de la tumeur.

Validation et évaluation clinique des résultats

Les résultats de l’étude montrent que les modifications du paysage répétitif sont largement présentes dans le génome du cancer et peuvent être détectées par le cfDNA pour une détection précoce du cancer et une surveillance des maladies. Plus précisément, le score Artemis du modèle d’apprentissage automatique peut distinguer les tissus cancéreux des tissus normaux, et il est étroitement lié à la survie globale et à la survie sans progression des patients.

Résultats de l’étude

Découverte préliminaire des éléments répétés à l’échelle du génome

Grâce à l’identification de novo, l’étude a découvert 1,2 milliard de kmers spécifiques, qui peuvent représenter 1280 types d’éléments répétés présents sur tous les chromosomes du génome entier. Une analyse plus approfondie de ces paysages répétitifs a révélé que 820 types d’éléments répétés montraient pour la première fois des variations dans le cancer.

Distribution génomique des éléments répétés et leur relation avec le cancer

L’enrichissement des éléments répétés dans les gènes cancéreux suggère que ces éléments peuvent jouer un rôle important dans le développement du cancer, par exemple en fonctionnant comme des points de changement structurel lors d’amplifications, de délétions et de réarrangements génétiques. De plus, l’enrichissement des éléments répétés aux points de rupture structurels dans certains types de cancer confirme leur rôle potentiel dans la promotion de ces altérations structurelles.

Détection du paysage des séquences répétées dans le cfDNA

L’étude montre que même avec un séquençage du génome entier à faible couverture, il est possible de détecter de manière fiable les variations du paysage répétitif dans le cfDNA. L’analyse a révélé que, dans différents types de cancer, de nombreux éléments répétés dans le cfDNA montrent des variations spécifiques cohérentes avec les tissus tumoraux. De plus, les changements dans l’état épigénétique (comme les marques d’histones) affectent également la représentation de ces éléments dans le cfDNA.

Évaluation des performances du modèle d’apprentissage automatique

Le score Artemis du modèle d’apprentissage automatique permet de distinguer efficacement les états cancéreux et normaux lors de l’analyse du cfDNA de patients cancéreux. De plus, le score du modèle est significativement associé à la survie globale et à la survie sans progression des patients, notamment chez les patients atteints de cancer avancé, où un score Artemis élevé est lié à un moins bon pronostic.

Potentiel d’application clinique

L’étude montre qu’en intégrant le score Artemis à d’autres caractéristiques de fragmentation du cfDNA, un modèle combiné peut être utilisé pour la détection précoce, la surveillance et l’inférence du tissu d’origine de la tumeur chez les patients cancéreux. En particulier, pour la détection du cancer du poumon et du foie, ce modèle combiné a montré une grande précision et fiabilité, offrant de nouvelles perspectives pour le dépistage précoce du cancer et le traitement personnalisé dans les applications cliniques futures.

Conclusion

En développant la méthode Artemis, cette étude propose une nouvelle méthode d’analyse basée sur les éléments répétés du génome entier, capable de détecter et de caractériser les variations étendues dans le cancer. Ces résultats révèlent non seulement les variations étendues des séquences répétées dans le génome du cancer, mais offrent également de nouvelles méthodes pour la détection précoce du cancer et la surveillance des maladies. À l’avenir, en optimisant et en validant davantage cette méthode, elle pourrait jouer un rôle crucial dans le diagnostic précoce et le traitement du cancer.

Importance de l’étude

Cette étude fournit des insights importants sur les variations des séquences répétées dans le génome du cancer, révélant leur rôle potentiel dans le développement du cancer. En même temps, la méthode Artemis proposée dans l’étude offre une nouvelle stratégie pour la détection non invasive du cancer basée sur le cfDNA, favorisant la détection précoce et les traitements précis. De plus, en analysant divers types de cancer, l’étude fournit des données importantes pour explorer les caractéristiques communes et les différences à l’échelle génomique entre différents types de tumeurs.