L'apprentissage profond multimodal améliore la prédiction du risque de récidive dans les gliomes de bas grade pédiatriques

L’application de l’apprentissage profond dans la prédiction de la récidive postopératoire des gliomes de bas grade pédiatriques

Contexte

Les gliomes de bas grade pédiatriques (Pediatric Low-Grade Gliomas, PLGGs) sont l’un des types de tumeurs cérébrales les plus courants chez les enfants, représentant 30 à 50 % de toutes les tumeurs du système nerveux central pédiatrique. Bien que le pronostic des PLGGs soit relativement bon, le risque de récidive postopératoire est difficile à prédire avec précision à l’aide des facteurs cliniques, radiologiques et génomiques traditionnels. L’hétérogénéité des récidives postopératoires complique les décisions de gestion postopératoire, en particulier en ce qui concerne les traitements adjuvants et la surveillance par imagerie. Par conséquent, le développement d’un outil capable de prédire avec précision le risque de récidive postopératoire est essentiel pour optimiser la gestion des patients et améliorer le pronostic.

Ces dernières années, l’apprentissage profond (Deep Learning, DL) a fait des progrès significatifs dans l’analyse d’images médicales, en particulier dans la segmentation des tumeurs et la prédiction du pronostic. Cependant, en raison de la rareté des PLGGs et de la pénurie de données, l’application de l’apprentissage profond dans ce domaine reste un défi. Cette étude vise à développer un modèle d’apprentissage profond multimodal combinant l’imagerie par résonance magnétique (IRM) préopératoire et les données cliniques pour améliorer la prédiction du risque de récidive postopératoire des PLGGs.

Source de l’article

Cet article est le fruit d’une collaboration entre plusieurs institutions, avec comme principaux auteurs Maryamalsadat Mahootiha, Divyanshu Tak, Zezhong Ye, entre autres. L’auteur correspondant est Benjamin H. Kann, du Dana-Farber Cancer Institute et du Brigham and Women’s Hospital de la Harvard Medical School. L’article a été publié en avance le 30 août 2024 dans la revue Neuro-Oncology, avec le DOI 10.1093/neuonc/noae173.

Méthodologie et résultats

1. Jeu de données et prétraitement

Cette étude a utilisé des données provenant de deux institutions : le Dana-Farber/Boston Children’s Hospital (DF/BCH) et le Children’s Brain Tumor Network (CBTN). L’étude a inclus 396 patients, dont 200 provenant du DF/BCH et 196 du CBTN. Tous les patients avaient subi une intervention chirurgicale et disposaient d’images IRM préopératoires pondérées en T2. Les patients atteints de neurofibromatose ont été exclus en raison de leur trajectoire de maladie distincte par rapport aux autres PLGGs.

Les images IRM ont d’abord été converties du format DICOM au format NIfTI, puis corrigées pour le biais de champ N4 afin d’éliminer les inhomogénéités de faible fréquence. Toutes les images ont été rééchantillonnées à une résolution de 1×1×3 mm³ et alignées par enregistrement rigide. Ensuite, l’extraction du tissu cérébral a été réalisée à l’aide du logiciel HD-BET.

2. Extraction des caractéristiques par apprentissage profond

L’étude a utilisé un modèle de segmentation 3D de tumeurs pré-entraîné (basé sur l’architecture UNet) pour extraire les caractéristiques radiologiques des PLGGs. Ce modèle avait été précédemment affiné sur des données de patients du CBTN, mais n’avait pas été entraîné sur des données de patients du DF/BCH. Grâce à l’apprentissage par transfert (Transfer Learning), les chercheurs ont extrait 4096 caractéristiques de haute dimension à partir de l’encodeur du modèle de segmentation, censées capturer une représentation abstraite de la tumeur.

3. Prédiction de la survie sans événement (EFS)

Les chercheurs ont développé un pipeline d’apprentissage profond entièrement automatisé, combinant le modèle de segmentation, l’extracteur de caractéristiques et un réseau neuronal à trois couches entièrement connectées pour prédire l’EFS postopératoire. Trois modèles ont été entraînés : 1) un modèle utilisant uniquement des caractéristiques cliniques (comme l’âge et le statut de résection) ; 2) un modèle utilisant uniquement les caractéristiques DL-IRM ; 3) un modèle multimodal combinant les caractéristiques cliniques et DL-IRM.

4. Entraînement et validation des modèles

Les données des deux institutions ont été fusionnées et divisées de manière aléatoire et stratifiée selon le statut EFS et la source des données, 70 % étant utilisés pour le développement du modèle et 30 % pour les tests. La performance moyenne des modèles a été évaluée par validation croisée à 3 plis. L’étude a également exploré l’impact de l’affinage des modèles sur des données provenant de différentes institutions.

5. Évaluation des performances des modèles

Sur l’ensemble de test, l’indice C (C-index) du modèle multimodal était de 0,85 (IC à 95 % : 0,81-0,93), significativement supérieur à celui des modèles utilisant uniquement les caractéristiques DL-IRM (C-index : 0,79) ou uniquement les caractéristiques cliniques (C-index : 0,72). Le modèle multimodal a également obtenu une AUC de 0,88 pour la prédiction de l’EFS à 3 ans, surpassant les deux autres modèles.

6. Stratification du risque

Le modèle multimodal a permis de diviser les patients en groupes à faible risque et à haut risque, avec un EFS à 3 ans de 92 % pour le groupe à faible risque contre seulement 31 % pour le groupe à haut risque (p < 0,0001). En revanche, les modèles utilisant uniquement les caractéristiques DL-IRM ou cliniques ont montré une performance inférieure en matière de stratification du risque.

Conclusion et implications

Cette étude est la première à démontrer l’application de l’apprentissage profond multimodal dans la prédiction de la récidive postopératoire des PLGGs. En combinant les images IRM préopératoires et les données cliniques, le modèle d’apprentissage profond a significativement amélioré la précision de la prédiction du risque de récidive postopératoire et offre un soutien solide pour les décisions de gestion postopératoire. L’étude démontre également l’efficacité de l’apprentissage par transfert sur de petits ensembles de données, ouvrant de nouvelles perspectives pour les applications dans les maladies rares.

Points forts de l’étude

  1. Apprentissage profond multimodal : Première combinaison de caractéristiques radiologiques IRM et de données cliniques, améliorant significativement la prédiction du risque de récidive postopératoire des PLGGs.
  2. Application de l’apprentissage par transfert : Extraction de caractéristiques radiologiques à partir d’un modèle de segmentation pré-entraîné, surmontant les problèmes de pénurie de données.
  3. Pipeline automatisé : Développement d’un pipeline d’apprentissage profond entièrement automatisé, capable de générer rapidement des courbes de prédiction EFS personnalisées, avec un potentiel clinique élevé.

Perspectives futures

Bien que cette étude ait obtenu des résultats significatifs, une validation externe sur des ensembles de données plus vastes et multicentriques est nécessaire pour améliorer davantage la généralisation du modèle. De plus, les recherches futures pourraient explorer l’impact des traitements adjuvants sur la performance du modèle et étudier comment intégrer le modèle dans les workflows cliniques pour optimiser la gestion des patients.