Réseau de Neurones Graphique pour l'Apprentissage de la Représentation du Cancer du Poumon

Diagramme de flux de recherche

Apprentissage de représentation du cancer du poumon basé sur les réseaux de neurones graphiques

Introduction

Avec le développement rapide de la pathologie numérique, les systèmes de diagnostic basés sur l’image deviennent de plus en plus importants pour des diagnostics pathologiques précis. Ces systèmes reposent sur des techniques d’apprentissage par multiples instances (Multiple Instance Learning, MIL) appliquées aux images de lames entières (Whole Slide Images, WSIs). Cependant, la question de comment représenter efficacement les WSIs reste un problème urgent à résoudre. L’émergence des réseaux neuronaux profonds a permis des avancées révolutionnaires en calcul visuel, mais les méthodes de réseaux neuronaux actuelles rencontrent encore des défis majeurs face à la quantité massive de pixels dans chaque WSI. Ces dernières années, certaines recherches ont exploré des modèles basés sur les graphes pour tenter de capturer les relations complexes dans les images pendant le processus d’intégration et de représentation des WSIs.

Source de l’article

Cette recherche a été réalisée par les auteurs suivants : Rukhma Aftab, Yan Qiang, Juanjuan Zhao, Zia Urrehman et Zijuan Zhao. Ils sont tous issus de l’École d’Informatique et de Calcul de l’Université de Technologie de Taiyuan. L’article a été publié dans la revue « BMC Cancer » en 2023. Le titre de l’article est « Graph neural network for representation learning of lung cancer » (DOI: https://doi.org/10.1186/s12885-023-11516-8).

Détails du processus de recherche

Cette étude propose une méthode MIL basée sur des graphes, nommée MIL-GNN. La recherche se divise en plusieurs étapes principales :

Sélection du jeu de données et prétraitement de l’image

Cette étude a choisi le jeu de données classique de MIL, MUSK, ainsi que des données d’images de deux sous-types de cancer du poumon - carcinome pulmonaire à cellules non petites (Non-Small Cell Lung Cancer, NSCLC) et cancer pulmonaire à petites cellules (Small Cell Lung Cancer, SCLC) pour validation. Les patchs ont été extraits des WSIs par la méthode de la fenêtre glissante (sliding window tiling) et les vecteurs caractéristique de chaque patch ont été extraits à l’aide d’un réseau de neurones convolutionnel (Convolutional Neural Network, CNN) pré-entraîné pour construire une structure de graphe entièrement connectée.

Application des réseaux de neurones graphiques (Graph Neural Networks, GNNs)

Dans la structure de graphe, chaque patch est représenté comme un nœud, et les relations entre les nœuds sont apprises par un modèle de mélange gaussien (Gaussian Mixture Model). Cette étude utilise un modèle d’auto-encodeur variationnel de graphes basé sur la convolution GMM (Variational Graph Auto-Encoder, VGAE) pour capturer les interactions entre les patchs et les compresser en une représentation de graphe compacte.

Entraînement du modèle et processus expérimental

Deux étapes clés incluent :

  1. Construction de la structure de graphe et extraction de caractéristiques : Chaque WSI est d’abord passé à travers un CNN pour l’extraction de caractéristiques, puis une matrice de caractéristiques de patch est utilisée pour construire les nœuds et la matrice d’adjacence, qui sont ensuite entraînés via des couches GNN.
  2. Classification et évaluation : Les vecteurs de caractéristiques de graphe extraits sont appliqués à une tâche de classification, évaluée par une validation croisée à 10 plis (10-Fold Cross Validation), en utilisant des mesures telles que l’aire sous la courbe ROC (Area Under Curve, AUC) et le Score F1 pour évaluer les performances du modèle.

Méthodes expérimentales spéciales et matériel

L’étude a spécialement conçu une méthode d’auto-encodeur de graphe basée sur la convolution de modèle de mélange gaussien (Graph Mixture Model Convolution, GMMConv) pour capturer les relations complexes des caractéristiques dans les WSIs. Un entraînement a été effectué en utilisant la bibliothèque PyTorch Geometric sur un GPU NVIDIA RTX3090, en veillant à une utilisation efficace de la mémoire pour chaque WSI traité par les réseaux de neurones graphiques.

Résultats de la recherche

Principales conclusions

Les résultats expérimentaux montrent que MIL-GNN a atteint une précision de 97,42% sur le jeu de données MUSK et un AUC de 94,3% pour les tâches de classification LUAD et LUSC. L’étude démontre l’efficacité de la méthode MIL basée sur des graphes dans l’apprentissage de la représentation des WSIs et offre un nouveau paradigme d’apprentissage pour les images de lames entières.

Innovations méthodologiques et valeur de la recherche

  1. Application des réseaux de neurones graphiques dans le MIL : Cette étude utilise des réseaux de neurones graphiques pour capturer et représenter les relations complexes dans les WSIs, améliorant ainsi la capacité de représentation des images pathologiques.
  2. Méthode de représentation efficace de la structure de graphe : La compression et la représentation efficaces des données WSI sont réalisées par GMMConv, augmentant de manière significative les performances des tâches de classification.
  3. Explicabilité et visualisation : La visualisation de la matrice d’adjacence permet de voir l’importance que le modèle attribue à chaque patch, ce qui non seulement améliore l’explicabilité du modèle mais offre également aux pathologistes un outil de diagnostic plus intuitif.

Points forts de la recherche

  1. Comparaison avec des méthodes de modèles de génération : Par rapport à de nombreuses méthodes avancées de MIL (comme ABMIL, Gated-ABMIL, etc.), MIL-GNN a montré des performances significativement supérieures, en particulier avec le jeu de données MUSK et le jeu de données de cancer du poumon TCGA, en termes d’AUC et de précision.
  2. Paradigme d’apprentissage au niveau des instances : L’étude propose une nouvelle méthode d’apprentissage basée sur les instances, rendant la représentation du patch et la représentation globale de l’image pathologique plus étroitement liées.
  3. Combinaison de l’apprentissage profond et de l’expression graphique : L’utilisation de techniques d’apprentissage profond pour extraire des informations de nœud des caractéristiques de patch, puis d’un auto-encodeur variationnel de graphes pour compresser et représenter les images de lames entières, afin de les utiliser dans des tâches de classification, améliore grandement l’efficacité et la précision de l’analyse d’images.

Discussion et conclusion

La méthode MIL-GNN proposée dans cette étude représente les WSIs sous forme d’une structure de graphe dense, capturant efficacement les caractéristiques essentielles de l’image et améliorant les performances de classification. Cependant, le modèle peut parfois souffrir de surapprentissage dans certaines configurations. Les tâches de recherche future incluront l’optimisation des modèles de réseaux neuronaux graphiques profonds, l’exploration de mécanismes d’entraînement automatiques et la découverte de caractéristiques structurelles pathologiques plus significatives.

Signification et valeur de l’article

Cette étude offre non seulement une méthode efficace de représentation des images de lames entières en pathologie numérique, mais elle a également obtenu des résultats significatifs en termes d’explicabilité et de performance du modèle. Les recherches futures continueront à perfectionner ce cadre et à explorer davantage de scénarios d’application basés sur la représentation graphique en pathologie numérique.