Portail de survivance de St. Jude : partage et analyse de grands ensembles de données cliniques et génomiques de survivants du cancer pédiatrique
St. Jude Survivorship Portal : Analyse et partage de données cliniques et génomiques à grande échelle sur les survivants du cancer pédiatrique
Contexte de l’étude
Aux États-Unis, le taux de survie à cinq ans des cancers pédiatriques est passé d’environ 60 % dans les années 1970 à plus de 85 % aujourd’hui. Malgré cette amélioration significative du taux de survie, les survivants de cancers pédiatriques sont confrontés à divers résultats de santé défavorables dus au cancer et à son traitement. Ces résultats négatifs incluent une mortalité prématurée, des dysfonctionnements organiques, de nouvelles tumeurs, des conséquences socio-économiques défavorables, des défis psychosociaux et une diminution générale de la qualité de vie. Pour traiter ces problèmes, les recherches se concentrent principalement sur l’identification des causes sous-jacentes, des risques associés et des sous-groupes de patients les plus vulnérables.
Des études longitudinales à grande échelle, telles que la cohorte St. Jude Lifetime (SJLife) et l’étude sur les survivants du cancer de l’enfance (CCSS), ont généré une grande quantité de données complètes sur les survivants, couvrant la démographie, les diagnostics, les traitements, les évaluations cliniques, les états de santé chroniques, les auto-déclarations et les données de séquençage complet du génome (WGS). Ces données sont une ressource inestimable pour la communauté de recherche sur les survivants et ont été utilisées dans des centaines de publications de recherche au cours des 25 dernières années.
Source de l’étude
Cet article intitulé « St. Jude Survivorship Portal : Sharing and Analyzing Large Clinical and Genomic Datasets from Pediatric Cancer Survivors » est réalisé par les chercheurs Gavriel Y. Matt, Edgar Sioson, Kyla Shelton, Jian Wang, Congyu Lu et d’autres, issus de l’hôpital de recherche pour enfants St. Jude et d’autres institutions de recherche. L’article a été publié dans la revue “Cancer Discovery”.
Processus de l’étude
Afin d’améliorer l’accessibilité des données sur les survivants du cancer, l’équipe de recherche a développé le St. Jude Survivorship Portal, le premier portail permettant de partager et d’explorer les données sur les survivants de cancers pédiatriques. Ce portail contient des données cliniques complètes et des données de génotype germinal uniformisées provenant de plus de 7 700 survivants de cancers pédiatriques.
Partage de données et fonctionnalités
Types de données: Le portail intègre les données des deux cohortes de survivants, SJLife et CCSS, comprenant en tout 5 053 survivants de SJLife et 2 688 survivants de CCSS. Les données de la cohorte incluent diverses variables allant de la démographie, diagnostic du cancer, traitements, évaluations cliniques et états de santé chroniques aux auto-déclarations, avec plus de 1 600 variables phénotypiques et 400 millions de variations génétiques.
Visualisation et analyse des données: Les utilisateurs peuvent accéder et explorer ces données à travers un dictionnaire de données interactif et navigateur de gènes sur le portail. Les statistiques sommaires des variables sont calculées dynamiquement et visualisées à travers des graphiques interactifs personnalisables, y compris des diagrammes en barres, des violons de distribution et des graphiques de dispersion.
Outils d’analyse: Le portail propose divers outils d’analyse, notamment l’analyse de l’incidence cumulative et l’analyse de régression. Les utilisateurs peuvent utiliser ces outils pour analyser les données des survivants en temps réel. En outre, une interface d’accès contrôlé permet aux utilisateurs de télécharger des données individuelles des survivants pour une analyse hors ligne.
Description détaillée du flux de travail
Acquisition des données: Tout d’abord, toutes les données pertinentes sont obtenues à partir des deux principales sources de données (SJLife et CCSS).
- SJLife : Inclut les survivants traités au St. Jude Children’s Research Hospital de 1962 à 2012.
- CCSS : Inclut les survivants traités dans 31 centres de cancérologie pédiatrique aux États-Unis et au Canada de 1970 à 1999.
- Données de séquençage complet du génome (WGS) : réalisées sur des échantillons de sang avec une couverture supérieure à 30 fois.
Traitement et stockage des données: Les données phénotypiques et génotypiques collectées sont traitées et stockées.
- Données phénotypiques : organisées dans des dictionnaires de données hiérarchiques pour faciliter la navigation des utilisateurs.
- Données génotypiques : générées par des appels variantiels et des analyses de génotype jointes.
Développement et mise en œuvre du portail: Grâce à des techniques d’ingénierie avancées, assurer que les utilisateurs puissent explorer et analyser les données en temps réel dans le portail.
- Stack technologique : Langage JavaScript, environnement Node.js, SQLite, etc.
Analyses et résultats
Analyse des données phénotypiques et génétiques: Exploration des données des cohortes de survivants via le dictionnaire de données du portail et le navigateur de gènes. Les utilisateurs peuvent sélectionner différentes variables pour visualiser leurs statistiques sommaires et visualiser les données à travers des graphiques interactifs. Par exemple, les utilisateurs peuvent analyser la variation génétique dans un groupe de diagnostic spécifique de cancer et ses relations avec l’origine ethnique des patients.
Analyse de l’ototoxicité: L’équipe de recherche a appliqué les fonctions de regroupement et de visualisation sommaire du portail pour étudier les effets ototoxiques des agents chimiothérapeutiques à base de platine (comme le cisplatine et le carboplatine). Les résultats montrent que les survivants traités au cisplatine sont plus susceptibles de souffrir de pertes auditives sévères, tandis que le carboplatine présente une ototoxicité relativement moindre.
Liaison entre santé mentale et amputation: En utilisant la fonction d’analyse de régression du portail, les chercheurs ont identifié de nouvelles interactions entre la santé mentale, l’âge et l’amputation. Les données montrent que la santé mentale des survivants amputés est influencée par l’âge, avec un risque plus élevé de problèmes de santé mentale chez les jeunes patients, probablement parce que les patients plus âgés s’adaptent et récupèrent mieux après une amputation.
Analyse de l’incidence cumulative et des associations génétiques de la cardiomyopathie: L’étude révèle que le risque plus élevé de cardiomyopathie chez les survivants afro-américains est principalement entraîné par les hommes. En outre, une étude du locus génétique NRG1 a identifié des variations significativement associées à la cardiomyopathie chez les survivants afro-américains.
Points forts de l’étude
Accès ouvert aux données: Le portail St. Jude Survivorship, offrant des fonctions d’exploration et d’analyse de données en temps réel, est le premier portail partagé publiquement pour explorer les données des survivants de cancers pédiatriques, fournissant ainsi un puissant outil de recherche pour la communauté.
Valeur scientifique des découvertes: Grâce au portail, les chercheurs peuvent facilement valider et explorer des études d’association, telles que celles sur le gène ARID5B, et découvrir de nouveaux haplotypes liés au risque de cardiomyopathie sur le locus génétique Magi3, favorisant ainsi la transparence et la reproductibilité de la recherche.
Projets d’extension future: Des plans sont en place pour inclure des données longitudinales, des données multi-omiques à cellule unique et des données d’images dans le portail. Enrichissant continuellement le type de données et les fonctionnalités disponibles, cela élargira les cohortes étudiées, améliorera les normes de diagnostic et de traitement, et stimulera des recherches plus approfondies sur les survivants.
Le St. Jude Survivorship Portal, en offrant un accès à des données cliniques et génomiques à grande échelle et à des outils d’analyse, a considérablement stimulé la recherche sur les survivants de cancers pédiatriques. Les plans d’expansion futurs rehausseront encore sa valeur scientifique, fournissant un solide support de données pour des recherches à long terme.