SCICONE : Appel de nombre de copies et reconstruction de l'histoire des événements à cellule unique

Au cours du développement des tumeurs, les altérations du nombre de copies génomiques (Copy Number Alterations, CNAs) sont un facteur clé qui influence l’hétérogénéité et l’évolution tumorales. Comprendre ces variations est essentiel pour développer des méthodes de diagnostic et de traitement personnalisées du cancer. Le séquençage unicellulaire offre la plus haute résolution pour l’analyse des nombres de copies, permettant d’atteindre le niveau de la cellule individuelle. Cependant, les données de séquençage du génome entier à faible profondeur de lecture (low read-depth) posent d’importants défis statistiques et informatiques pour la détection des variations du nombre de copies. Les méthodes de calcul existantes ignorent souvent les relations évolutives entre les cellules, ce qui entraîne des résultats de détection peu précis. Par conséquent, le développement d’une méthode de détection des nombres de copies qui intègre l’histoire évolutive des cellules est devenu une nécessité urgente dans la recherche actuelle.

Source de l’article

Cet article est le fruit d’une collaboration entre l’ETH Zurich (l’École polytechnique fédérale de Zurich) et le SIB Swiss Institute of Bioinformatics (l’Institut suisse de bioinformatique). Les principaux auteurs incluent Jack Kuipers, Mustafa Anıl Tuncel, Pedro F. Ferreira, Katharina Jahn et Niko Beerenwinkel. L’article a été publié en 2025 dans la revue Bioinformatics sous le titre “Single-cell copy number calling and event history reconstruction”.

Processus de recherche

1. Objectif de l’étude et aperçu des méthodes

L’objectif principal de cette étude est de développer un modèle statistique appelé SCICONE, ainsi qu’un algorithme de Monte Carlo par chaînes de Markov (MCMC), pour reconstruire l’histoire des événements de variation du nombre de copies à partir de données de séquençage du génome entier à faible profondeur de lecture, et pour déduire les profils de nombre de copies des cellules individuelles. SCICONE améliore la précision de la détection des nombres de copies en intégrant les relations évolutives entre les cellules.

2. Prétraitement des données et segmentation

L’étude commence par le prétraitement des données de séquençage unicellulaire, y compris la correction des biais liés au contenu GC et à la cartographie. Ensuite, une méthode de programmation dynamique est utilisée pour détecter les points de rupture (breakpoints) dans le génome, divisant ainsi le génome en segments avec le même nombre de copies. Cette étape clé consiste à combiner les signaux de plusieurs cellules pour identifier les régions où les variations du nombre de copies sont significatives.

3. Construction de l’arbre des événements de nombre de copies

SCICONE modélise l’histoire évolutive de la tumeur en construisant un arbre des événements de nombre de copies (CNA tree). Les nœuds de l’arbre représentent les événements de nombre de copies (tels que les amplifications ou les délétions), tandis que la topologie de l’arbre reflète l’ordre et les relations entre ces événements. L’étude utilise un algorithme MCMC pour échantillonner l’arbre des événements, afin de trouver la structure d’arbre et la combinaison d’événements les plus probables.

4. Inférence des profils de nombre de copies

Sur la base de l’arbre des événements, SCICONE infère les profils de nombre de copies de chaque cellule. En attribuant les cellules aux nœuds de l’arbre des événements, l’étude peut déduire l’état du nombre de copies de chaque cellule en fonction des événements de nombre de copies le long du chemin. Ce processus améliore non seulement la précision de la détection des nombres de copies, mais révèle également la structure clonale de la tumeur.

5. Validation par des données simulées et réelles

L’étude valide les performances de SCICONE à l’aide de données simulées et d’échantillons tumoraux réels. Les données simulées couvrent différentes profondeurs de lecture et nombres de segments, montrant que SCICONE excelle dans des conditions de faible profondeur de lecture et de bruit élevé. Dans les données réelles, SCICONE a reconstruit avec succès l’histoire évolutive des nombres de copies d’un échantillon de cancer du sein triple négatif et a détecté des variations clés des gènes pilotes.

Résultats principaux

1. Validation sur des données simulées

Sur les données simulées, SCICONE a montré des performances exceptionnelles dans des conditions de faible profondeur de lecture (2x-8x) et de bruit élevé, avec une précision de détection des nombres de copies nettement supérieure à celle d’autres méthodes (comme HMMCopy, Ginkgo et Scope). En particulier, SCICONE a démontré un avantage marqué dans la détection des événements de nombre de copies sur de petits segments.

2. Application sur des données réelles

Dans un échantillon de cancer du sein triple négatif, SCICONE a reconstruit la structure clonale de la tumeur et a détecté des variations du nombre de copies dans des gènes clés tels que TP53, PIK3CA et AKT1. En outre, l’étude a identifié un événement de duplication du génome entier, qui revêt une importance significative dans l’évolution tumorale.

3. Comparaison des performances des algorithmes

Par rapport aux méthodes existantes de détection des nombres de copies, SCICONE a montré une amélioration significative en termes de précision et de robustesse. En particulier, dans le traitement des données à faible profondeur de lecture, SCICONE a été capable de mieux séparer le signal du bruit, fournissant des profils de nombre de copies plus fiables.

Conclusion et signification

En intégrant les relations évolutives entre les cellules, SCICONE propose une nouvelle méthode de détection des nombres de copies au niveau unicellulaire. Son avantage principal réside dans sa capacité à inférer simultanément les profils de nombre de copies et l’histoire évolutive, révélant ainsi plus précisément la structure clonale et la dynamique évolutive des tumeurs. Cette méthode a non seulement une valeur scientifique importante, mais elle fournit également un nouvel outil pour le traitement personnalisé du cancer.

Points forts de l’étude

  1. Intégration de l’histoire évolutive : SCICONE est la première méthode à combiner la détection des nombres de copies avec l’histoire évolutive des cellules, améliorant considérablement la précision de la détection.
  2. Détection des points de rupture par programmation dynamique : L’étude a développé une méthode de détection des points de rupture basée sur la programmation dynamique, capable d’identifier efficacement les régions de variation du nombre de copies.
  3. Optimisation de l’algorithme MCMC : Grâce à l’algorithme MCMC, SCICONE peut effectuer une recherche efficace dans l’espace complexe des structures d’arbres, trouvant ainsi le modèle évolutif le plus probable.
  4. Large potentiel d’application : SCICONE est non seulement applicable aux données de séquençage unicellulaire à faible profondeur de lecture, mais peut également être utilisé pour l’analyse de séquençage ciblé et de données multi-omiques, offrant un large potentiel d’application.

Autres informations utiles

L’équipe de recherche a également fourni une implémentation open-source de SCICONE, disponible sur GitHub (https://github.com/cbg-ethz/scicone). De plus, l’étude propose des workflows détaillés avec Snakemake, facilitant la reproduction des résultats expérimentaux par d’autres chercheurs.

Grâce à cette méthode innovante, des avancées supplémentaires sont attendues dans les domaines de l’analyse de l’évolution tumorale, du diagnostic du cancer et de l’optimisation des stratégies de traitement.