Autoencodeur Variationnel Désentrelacé Multimodal avec Interprétabilité Théorique pour la Classification des Gliomes
Application du Variational Autoencoder Démêlant Multimodal et de l’Interprétabilité Basée sur la Théorie des Jeux dans la Classification des Gliomes
Introduction
Dans le système nerveux central, les gliomes sont les tumeurs cérébrales primaires les plus courantes. Selon les activités cellulaires et le degré d’invasion, l’Organisation Mondiale de la Santé (OMS) les classe en grades I à IV, les grades I et II étant appelés gliomes de bas grade (LGG), et les grades III et IV étant appelés gliomes de haut grade (HGG). En pratique clinique, les décisions thérapeutiques doivent souvent être ajustées spécifiquement selon le grade de la tumeur. Par conséquent, une classification précise des gliomes est essentielle pour les décisions thérapeutiques, le traitement personnalisé et la prédiction du pronostic des patients. Actuellement, le standard de référence pour la classification des gliomes reste la biopsie chirurgicale ou l’analyse histopathologique. Cependant, cette méthode est invasive, non en temps réel, et peut entraîner des complications telles que des crises d’épilepsie, des infections, voire la dissémination de la tumeur le long du trajet de la biopsie. Par conséquent, il est crucial de développer un système de classification capable de diagnostiquer de manière non invasive et en temps réel les grades de gliomes avant la chirurgie.
L’imagerie par résonance magnétique (IRM) est couramment utilisée pour le diagnostic préopératoire clinique, la prise de décision thérapeutique et l’évaluation du pronostic chez les patients atteints de gliomes, et elle a prouvé être un outil non invasif prometteur. Les images IRM de traitement des gliomes obtenues classiquement incluent quatre modalités : séquence de récupération d’inversion atténuation fluidique (FLAIR), imagerie pondérée en T1 (T1), imagerie pondérée en T1 avec contraste (T1CE) et imagerie pondérée en T2 (T2). Chaque modalité reflète des signaux tissulaires différents. Plus précisément, la FLAIR peut montrer des signaux hautement hétérogènes d’infiltration tumorale et d’œdème ; le T1 fournit des signaux anatomiques ; le T1CE reflète les signaux des zones non renforcées et des tissus nécrotiques, tandis que le T2 est sensible aux zones d’œdème, fournissant des signaux sur les frontières tumorales et le degré d’œdème. Par conséquent, les images IRM multimodales traditionnelles peuvent clairement montrer l’intensité du signal et l’effet de masse des tissus hémorragiques, nécrotiques et œdémateux des gliomes. Les radiologues peuvent baser leurs décisions thérapeutiques sur ces informations combinées, mais cela reste un travail laborieux et inefficace.
Ces dernières années, certaines techniques IRM avancées comme l’imagerie par tenseur de diffusion (DTI) et le coefficient de diffusion apparent (ADC) fournissent des indices importants tels que la densité des fibres, les histogrammes ADC et la perméabilité, montrant un potentiel considérable dans la classification des gliomes. Cependant, ces techniques IRM avancées sont chronophages et coûteuses, et ne peuvent pas être utilisées de façon généralisée pour tous les patients. Par conséquent, il est urgent de fusionner efficacement les images IRM multimodales traditionnelles pour une classification précise des gliomes.
Description de l’origine
Cet article de recherche a été rédigé par Jianhong Cheng, Min Gao, Jin Liu, Hailin Yue, Hulin Kuang, Jun Liu et Jianxin Wang. Ils appartiennent respectivement au Laboratoire clé de bioinformatique de la province du Hunan et à l’École de science et d’ingénierie informatique de l’Université de l’Asie du Sud-Centrale, à l’Institut de recherche en technologie métrologique aérospatiale de Guizhou, au Département d’imagerie du deuxième hôpital Xiangya de l’Université de l’Asie du Sud-Centrale, et au Centre de contrôle de la qualité de l’imagerie de la province du Hunan. L’article a été publié dans l’IEEE Journal of Biomedical and Health Informatics en février 2022.
Détails du processus de recherche
a) Processus de travail de la recherche
Cette étude propose un modèle de Variational Autoencoder Démêlant Multimodal (MMD-VAE) pour la classification des gliomes basée sur les caractéristiques radiomiques extraites des images IRM multimodales préopératoires. La recherche comporte différentes étapes de traitement des données et des expériences, notamment :
Collecte et traitement des données : Les données de recherche proviennent du défi de segmentation des tumeurs cérébrales multimodales (BraTS) et des données cliniques du deuxième hôpital Xiangya de l’Université de l’Asie du Sud-Centrale. En tout, 1752 images IRM de 438 patients atteints de gliome ont été collectées, incluant FLAIR, T1, T1CE et T2.
Définition et segmentation des ROI : Toutes les images IRM préopératoires ont été repositionnées dans le système de coordonnées gauche-postérieur-supérieur (LPS), enregistrées à un modèle anatomique T1 unifié, et les crânes ont été enlevés en utilisant l’outil d’extraction cérébrale (BET). Selon le défi BraTS, trois types de ROI ont été considérés pour la segmentation : la tumeur non rehaussée (NET), la tumeur rehaussée (ET), et l’œdème (ED). Cette étude se concentre principalement sur la région NET en raison de sa forte hétérogénéité et de ses performances de prédiction.
Définition et extraction des caractéristiques radiomiques : Les images ROI ont été traitées à l’aide de 9 filtres (incluant original, pas de filtre, carré, racine carrée, logarithmique, exponentiel, gradient, transformation par ondelettes, motif local binaire et laplacien de gaussienne), et 2153 caractéristiques quantitatives ont été extraites. Les caractéristiques sont classées en sept catégories : statistiques de premier ordre, forme, matrice de cooccurrence des niveaux de gris (GLCM), matrice de dépendance des niveaux de gris (GLDM), matrice de longueur des niveaux de gris (GLRLM), matrice de zone de taille des niveaux de gris (GLSZM) et matrice de différence de tons de voisinage (NGTDM).
Variational Autoencoder Démêlant Multimodal : Le cadre MMD-VAE extrait les représentations latentes de chaque modalité à travers l’encodeur d’un variational autoencoder et ces représentations sont démêlées en représentations partagées et distinctives. L’encodeur est constitué de plusieurs couches denses et de la fonction d’activation ReLU, suivies de deux mappings linéaires pour démêler les représentations latentes. Le décodeur reconstruit les caractéristiques d’entrée à partir des vecteurs latents et la représentation partagée démêlée est également utilisée pour la reconstruction intermodale.
Prédicateur de classification des gliomes : Les représentations partagées et distinctives de chaque modalité sont combinées et entrent dans un prédicateur de classification des gliomes composé de deux couches cachées et d’une couche de sortie, donnant un résultat de probabilité prédictive à travers la fonction sigmoïde.
b) Principaux résultats de la recherche
Les résultats expérimentaux montrent que le modèle MMD-VAE proposé a présenté de bonnes performances prédictives sur deux ensembles de données de référence. Sur le jeu de données public, la valeur de l’AUC était de 0.9939, l’exactitude de 98.46%, la sensibilité de 100% et la spécificité de 94.12%. Sur le jeu de données privé interinstitutionnel, la valeur de l’AUC était de 0.9611, l’exactitude de 94.32%, la sensibilité de 96.72% et la spécificité de 88.89%. Ces résultats quantitatifs et interprétations peuvent aider les radiologues à mieux comprendre les gliomes et à soutenir l’amélioration des décisions thérapeutiques cliniques.
c) Conclusions et signification de la recherche
Cette étude introduit un modèle de variational autoencoder démêlant multimodal hautement efficace, capable de classifier les gliomes basés sur les caractéristiques radiomiques extraites des images IRM multimodales préopératoires. Cette approche améliore non seulement la précision de la prédiction des classifications, mais augmente également l’interprétabilité du modèle, ce qui est d’une importance capitale pour le diagnostic clinique et les décisions de traitement personnalisées. Grâce à la méthode SHAP, le modèle peut interpréter et analyser quantitativement les contributions des caractéristiques importantes à la classification, améliorant ainsi la compréhension des radiologues des gliomes et, par conséquent, la prédiction clinique.
d) Points forts de la recherche
- Méthode innovante de l’apprentissage des représentations démêlantes : extraction des informations complémentaires entre différentes modalités à travers le modèle variational autoencoder démêlant, améliorant ainsi la précision de la prédiction des classifications des gliomes.
- Modèle d’interprétation quantitative : utilisation de la méthode SHAP pour interpréter quantitativement l’impact des caractéristiques importantes sur la classification, rehaussant l’interprétabilité du modèle et aidant les cliniciens à mieux comprendre et appliquer les résultats.
- Performances prédictives exceptionnelles : obtenant des valeurs AUC et des précisions très élevées sur deux ensembles de données de référence, ce qui valide l’efficacité et la stabilité du modèle.
- Fusion multimodale : fusion réussie des données IRM multimodales, améliorant la robustesse et la capacité de généralisation du modèle.
La méthode proposée dans cet article a une valeur d’application importante dans la classification non invasive des gliomes et fournit de nouvelles perspectives et méthodes pour les recherches futures en analyse d’images.