Améliorer la segmentation des gliomes de bas grade pédiatriques grâce à l'apprentissage multitâche

Amélioration de la segmentation du gliome pédiatrique de bas grade par l’apprentissage multitâche

Introduction

La segmentation des tumeurs cérébrales chez les enfants est une tâche clé pour l’analyse du volume tumoral et les algorithmes d’intelligence artificielle. Cependant, ce processus est chronophage et nécessite l’expertise des neuroradiologues. Bien que de nombreuses recherches aient été consacrées à l’optimisation de la segmentation des tumeurs cérébrales chez les adultes, les études sur la segmentation des tumeurs pédiatriques guidées par l’intelligence artificielle sont rares. De plus, les caractéristiques des signaux IRM des tumeurs cérébrales des enfants et des adultes diffèrent, nécessitant des algorithmes de segmentation spécialement conçus pour les tumeurs cérébrales pédiatriques. Par conséquent, cet article propose d’ajouter un classificateur de mutations génétiques des tumeurs en tant que tâche auxiliaire au réseau principal pour améliorer la précision des résultats de segmentation par l’apprentissage multitâche profond (Deep Multitask Learning, DMTL).

Origine de l’article

Cette étude a été réalisée par les chercheurs suivants : Partoo Vafaeikia, Matthias W. Wagner, Cynthia Hawkins, Uri Tabori, Birgit B. Ertl-Wagner et Farzad Khalvati. Les institutions participantes incluent l’Hôpital pour enfants de Toronto, l’Université de Toronto et le Vector Institute au Canada. Cet article a été publié lors de la Conférence internationale annuelle 2022 de la Société IEEE d’ingénierie en médecine et biologie (EMBC).

Flux de travail

Méthodologie et configuration des expériences

Cette recherche propose un modèle basé sur l’IRM pour la segmentation des gliomes pédiatriques de bas grade (Pediatric Low-Grade Gliomas, PLGGs), tout en ajoutant la classification des mutations génétiques des tumeurs comme tâche auxiliaire. Le processus spécifique est le suivant :

  1. Préparation des données : les données ont été collectées à partir des séquences IRM FLAIR (Fluid-Attenuated Inversion Recovery) de 311 patients pédiatriques traités à l’hôpital pour enfants entre 2000 et 2018. La segmentation réelle des tumeurs (ground-truth) a été fournie conjointement par deux neuroradiologues et les marqueurs génétiques associés ont été évalués par biopsie.

  2. Architecture du modèle : le modèle est entraîné à partir du réseau U-Net. Pour générer des sorties de classification, une couche entièrement connectée est ajoutée à la couche bottleneck de l’U-Net, permettant ainsi un partage entre les tâches de segmentation et de classification. Cette recherche a été approuvée par le comité d’éthique de la recherche de l’hôpital pour enfants, qui a exempté la nécessité d’un consentement informé.

  3. Tâche de segmentation : un réseau U-Net basé sur une architecture Encoder-Decoder est utilisé, la partie encodage extrait principalement les caractéristiques de l’image, tandis que la partie décodage reconstruit le masque de segmentation. Pour assurer la cohérence des dimensions et du système de coordonnées des données, toutes les images sont enregistrées sur l’atlas cérébral SRI24 basé sur l’IRM avant l’exécution de l’algorithme de segmentation.

  4. Tâche de classification : la tâche de classification permet de reconnaître les trois principales mutations génétiques du PLGG : mutation BRAF V600E, fusion BRAF, ainsi que d’autres marqueurs moléculaires rares. Le réseau de classification est ajouté à la partie bottleneck de l’encodeur U-Net afin d’améliorer la capacité de généralisation du modèle par le partage de l’encodeur.

  5. Fonction de perte et optimisation : l’optimiseur Adam et des fonctions de perte spécifiques (Soft Dice Loss pour la segmentation et perte d’entropie croisée pondérée pour la classification) sont utilisés pour entraîner le modèle.

Résultats principaux

Les modèles de tâche unique et de multitâche ont été entraînés sur les mêmes ensembles de données de formation, de validation et de test. Les résultats montrent :

  • Lors de 4 tests, les performances de la méthode d’apprentissage multitâche en tâche de segmentation ont en moyenne augmenté de 3% sur l’ensemble de validation (de 0,77 à 0,80) et de 4% sur l’ensemble de test (de 0,74 à 0,78).
  • Pour les 2 autres tests, les performances des modèles multitâche et de tâche unique étaient similaires.
  • Globalement, les performances moyennes de segmentation sur les ensembles de validation et de test ont augmenté de 2,10% et de 3% respectivement grâce à l’apprentissage multitâche.

Cette amélioration des performances est principalement due à l’apprentissage par le modèle d’informations utiles liées aux caractéristiques génétiques par le biais de la tâche de classification, ce qui a renforcé la représentation des données, réduit le surapprentissage et amélioré la capacité de généralisation du modèle.

Présentation des données

Les résultats des expérimentations sont résumés dans le tableau ci-dessous, montrant les différences de performances entre les modèles de tâche unique et de multitâche sur divers environnements de division de données (chaque fois avec des ensembles de formation, de validation et de test différents) :

| Dice de validation | Dice de test | | Tâche unique | Multitâche | Tâche unique | Multitâche | | – | – | – | – | | 1 | 0.76 | 0.82 | 0.70 | 0.83 | | 2 | 0.75 | 0.80 | 0.76 | 0.77 | | 3 | 0.78 | 0.78 | 0.78 | 0.80 | | 4 | 0.79 | 0.80 | 0.73 | 0.74 | | 5 | 0.76 | 0.77 | 0.80 | 0.80 | | 6 | 0.76 | 0.76 | 0.70 | 0.70 | | Dice moyen | 0.77 | 0.79 | 0.74 | 0.77 |

Conclusions et implications de la recherche

Cette étude propose une approche basée sur l’apprentissage profond multitâche pour améliorer la performance de la segmentation des gliomes pédiatriques de bas grade (PLGGs) sur les IRM. En ajoutant le classificateur de marqueurs génétiques comme tâche auxiliaire, cette méthode a montré une amélioration significative des performances de segmentation. Comparé aux modèles traditionnels de tâche unique, le modèle de multitâche a amélioré les performances de segmentation de 2,10% sur l’ensemble de validation et de 3% sur l’ensemble de test, démontrant une bonne capacité de généralisation et une grande valeur pratique.

L’innovation de cette approche réside non seulement dans l’utilisation des tâches auxiliaires pour améliorer les performances de la tâche principale, mais aussi dans l’intégration de technologies avancées d’apprentissage profond (tels que les modules ResNet et l’architecture U-Net) appliquées au domaine des tumeurs pédiatriques, ouvrant ainsi de nouvelles perspectives pour l’évaluation non invasive des marqueurs génétiques.

Points forts et valeur de la recherche

  1. Algorithme innovant : la méthode proposée d’apprentissage multitâche, en utilisant la classification des marqueurs génétiques comme tâche auxiliaire pour la segmentation, a montré une capacité de représentation plus élevée.
  2. Applications étendues : cette méthode n’améliore pas seulement la segmentation des tumeurs pédiatriques, mais jette également les bases de futures recherches pour des diagnostics non invasifs.
  3. Amélioration de la précision : avec une performance significativement améliorée dans des environnements de test réels, cette approche a un potentiel important pour l’application clinique.
  4. Traitement des données : cette recherche aborde également les défis posés par les différences de caractéristiques de signal IRM entre les enfants et les adultes, soulignant l’importance de développer des modèles adaptés à des populations spécifiques.

Grâce à cette approche de recherche globale et à une validation expérimentale, notre étude apporte des progrès significatifs dans le domaine de la segmentation des gliomes pédiatriques de bas grade, ouvrant la voie à de futures recherches et applications cliniques.