Un Cadre CNN Guidé par l'Attention pour la Segmentation et la Classification du Gliome à l'Aide de Scans IRM 3D

Cadre CNN guidé par l’attention pour l’étude de segmentation et de classification des gliomes dans les scans IRM 3D

Les gliomes sont les formes de tumeurs cérébrales les plus mortelles chez l’homme. Un diagnostic rapide de ces tumeurs est une étape importante pour un traitement efficace des tumeurs. L’imagerie par résonance magnétique (IRM) offre généralement une examen non invasif des lésions cérébrales. Cependant, l’inspection manuelle des tumeurs dans les scans IRM nécessite beaucoup de temps et est sujette à des erreurs. Par conséquent, le diagnostic automatisé des tumeurs joue un rôle crucial dans la gestion clinique et l’intervention chirurgicale des gliomes. Dans cette étude, nous proposons un cadre basé sur un réseau de neurones convolutionnels (CNN) pour la classification non invasive des tumeurs à partir de scans IRM 3D.

Introduction

Les gliomes sont des tumeurs cérébrales communes et mortelles, classifiées en quatre grades selon leur agressivité et leur malignité. Les tumeurs de bas grade (grades I-III) sont généralement moins agressives et répondent mieux aux traitements. Cependant, les tumeurs de haut grade (grade IV), comme le glioblastome, sont hautement agressives et ont des résultats de traitement médiocres, avec seulement 5% des patients survivant cinq ans.

Pour la recherche sur les gliomes à l’aide d’images médicales, les chercheurs se fient souvent aux imageries médicales, et en particulier à l’IRM. Les images IRM fournissent une observation haute résolution spatiale et temporelle des tissus cérébraux, ce qui en fait un outil essentiel pour l’analyse des tumeurs cérébrales dans la recherche. De plus, la classification des gliomes implique des caractéristiques génétiques comme la mutation de l’isocitrate déshydrogénase (IDH) et le statut des bras chromosomiques 1p/19q. Ces marqueurs moléculaires jouent un rôle important dans la réponse des tumeurs aux traitements.

Institutions de Recherche et Informations de Publication

Cette étude a été réalisée par Prasun Chandra Tripathi et Soumen Bag de l’Indian Institute of Technology (ISM) à Dhanbad, en Inde. Cet article a été publié le 9 novembre 2022 dans l’IEEE/ACM Transactions on Computational Biology and Bioinformatics.

Méthodologie

La méthodologie de recherche est divisée en deux étapes principales : la segmentation et la classification des gliomes. Le réseau de segmentation adopte une architecture encodeur-décodeur, tandis que le réseau de classification utilise une stratégie d’apprentissage multitâche.

Réseau de Segmentation

L’architecture du réseau de segmentation est la suivante :

  • Données d’entrée : Images IRM, incluant quatre modes : T1, T1c, T2 et FLAIR.
  • Partie encodeur : Trois couches de sous-échantillonnage, chaque couche réduisant la taille des données d’entrée par deux, incluant plusieurs blocs résiduels.
  • Partie de transition : Blocs résiduels, utilisés pour extraire des caractéristiques profondes à partir des caractéristiques encodées.
  • Partie décodeur : Trois couches de sur-échantillonnage, utilisées pour restaurer la taille d’origine, incluant des connexions de saut longues pour conserver les caractéristiques d’image de bas niveau.

Le réseau de segmentation introduit également des mécanismes d’attention spatiale et de canal pour affiner les cartes de caractéristiques. Les mécanismes d’attention permettent de sélectionner des informations pertinentes tout en ignorant les contenus non pertinents, réalisable par l’attention de canal et l’attention spatiale dans le CNN.

Réseau de Classification Multitâche

L’architecture du réseau de classification est la suivante :

  • Données d’entrée : Régions tumorales 3D obtenues par segmentation.
  • Réseau de base partagé : Plusieurs couches de convolution et blocs résiduels pour extraire les caractéristiques.
  • Couches spécifiques aux tâches : Trois couches entièrement connectées, responsables de la classification des tumeurs de bas/haut grade, de la prédiction du statut chromosomique 1p/19q et de la prédiction du statut de mutation de l’IDH, respectivement.

L’apprentissage multitâche tire parti du partage d’informations entre les différentes tâches, améliorant ainsi la précision de la classification.

Résultats Expérimentaux

Les données utilisées dans les expériences incluent les jeux de données BraTS 2019 et les données IRM multimodales de l’Archive des Imageries du Cancer, comprenant des images IRM de 617 patients. Ces images ont été utilisées pour entraîner et valider le modèle, et pour évaluer les performances du modèle.

Résultats de la Segmentation

Les performances de segmentation ont été évaluées à travers des métriques telles que le coefficient de similarité de Dice (DSC), la distance de Hausdorff, la sensibilité et la spécificité. Les résultats expérimentaux montrent que les mécanismes d’attention spatiale et de canal améliorent de manière significative les performances du modèle dans la tâche de segmentation.

Exemples : - DSC pour la région de la tumeur rehaussée : de 0.7612 à 0.7712 - DSC pour la région de la tumeur complète : de 0.8721 à 0.9002 - DSC pour la région de la tumeur noyau : de 0.8090 à 0.8230

Résultats de la Classification

Les performances de la classification ont été évaluées avec la précision de la classification, la pertinence, la spécificité, la sensibilité et le score F1. Le réseau de classification multitâche a montré d’excellentes performances dans les trois tâches, avec une amélioration notable de la précision de la classification après utilisation des mécanismes d’attention spatiale et de canal.

Exemples : - Précision de la classification des bas/haut grades : de 91.00% à 95.86% - Précision de la classification du statut IDH : de 87.94% à 91.96% - Précision de la classification du statut 1p/19q : de 81.20% à 87.88%

Conclusion et Importance de l’Étude

En introduisant des mécanismes d’attention, le cadre CNN proposé montre des avantages significatifs dans les tâches de segmentation et de classification des gliomes. En particulier, la stratégie d’apprentissage multitâche a amélioré la robustesse et l’efficacité du modèle pour résoudre les problèmes de classification multitâche. Cette étude fournit une nouvelle méthode non invasive pour le diagnostic et l’évaluation des gliomes, possédant une valeur scientifique et un potentiel d’application clinique importants.

À l’avenir, nous tenterons de développer des modèles combinant des architectures CNN-Transformer pour améliorer davantage les performances des tâches multiples de classification et de segmentation, offrant ainsi des outils plus efficaces pour le diagnostic et le traitement des gliomes.