Un nouveau pipeline de segmentation d'image basé sur CNN pour la modélisation de la stimulation de la moelle épinière féline individualisée
Pipeline de segmentation d’images basée sur les réseaux de neurones convolutifs (CNN) pour la modélisation de stimulation individualisée de la moelle épinière féline
Contexte et motivation de la recherche
La stimulation de la moelle épinière (Spinal Cord Stimulation, SCS) est une méthode thérapeutique largement utilisée pour la gestion de la douleur chronique. Ces dernières années, elle a également été utilisée pour moduler l’activité neuronale, dans le but de restaurer les fonctions motrices autonomes ou sensitives perdues. La modélisation et la planification de traitement personnalisées sont des aspects cruciaux pour garantir l’innocuité et l’efficacité de la SCS. Cependant, la génération de modèles de colonne vertébrale avec le niveau de détail et de précision requis nécessite une segmentation d’images manuelle chronophage et fastidieuse, réalisée par des experts humains. Par conséquent, il est impératif de disposer d’algorithmes de segmentation automatisés capables de générer des modèles anatomiques de haute qualité à partir d’un ensemble de données limité.
Source de l’article
Cet article a été rédigé par Alessandro Fasse, Taylor Newton, Lucy Liang, Uzoma Agbor, Cecelia Rowland, Niels Kuster, Robert Gaunt, Elvira Pirondini et Esra Neufeld, provenant respectivement de la Foundation for Research on Information Technologies in Society (IT’IS) et de l’Institut Fédéral de Technologie Suisse (ETH) en Suisse, ainsi que des Rehab and Neural Engineering Labs et du Center for Neural Basis of Cognition de l’Université de Pittsburgh aux États-Unis. L’article a été publié en 2023 dans la revue scientifique Journal of Neural Engineering.
Méthodologie de recherche
L’article présente un pipeline de segmentation automatique des images IRM de la moelle épinière et de génération de modèles basé sur les réseaux de neurones convolutifs (Convolutional Neural Network, CNN), comprenant les étapes suivantes :
Prétraitement d’image
- Correction de biais N4ITK pour améliorer l’uniformité des images IRM.
- Algorithme de masquage adaptatif pour extraire la région d’intérêt (ROI) et réduire le bruit de fond.
Augmentation de données
- Génération de variantes d’images par transformations affines telles que le déplacement, la rotation et la mise à l’échelle pour améliorer la généralisation du réseau. 2 à 5 images augmentées sont générées pour chaque image d’entraînement.
Transfert d’apprentissage
- Initialisation des poids du réseau à partir de ceux entraînés sur un autre jeu de données pour réduire le temps d’entraînement et améliorer les performances.
Post-traitement
- Programme de nettoyage automatique pour identifier et conserver la principale composante connexe et supprimer les régions de bruit isolées, assurant ainsi la cohérence du modèle.
Acquisition et annotation des données
Les données IRM de la moelle épinière de trois chats ont été utilisées : 1. LS1 : région lombo-sacrée du chat. 2. LS2 : région lombaire et partie de la région sacrée du chat. 3. CS1 : région cervicale du chat.
Chaque échantillon a été segmenté manuellement, fournissant les données de base pour l’entraînement et la validation du réseau neuronal. Les segmentations incluent le liquide céphalo-rachidien (LCR), les racines dorsales, la graisse épidurale, la substance grise, les racines ventrales et la substance blanche.
Architecture du réseau neuronal
Une architecture HardNet optimisée a été utilisée, combinant des blocs HardNet performants avec peu de données et un décodeur à champs récepteurs (RFB), formant des couches de convolution et de transformation :
- Blocs HardNet : optimisent l’utilisation de la bande passante mémoire GPU et accélèrent la convergence en réduisant le nombre de poids.
- Blocs à champs récepteurs (RFB) : améliorent la généralisation et la précision du réseau sur de petits ensembles de données.
Détails de l’entraînement
- Augmentation de données : diverses transformations affines ont été appliquées via la bibliothèque Python Albumentations pour augmenter la diversité des images.
- Algorithme d’optimisation : l’optimiseur Adam a été utilisé pour la rétropropagation, avec une diminution progressive du taux d’apprentissage pour améliorer la convergence du réseau.
Évaluation des performances
Les métriques suivantes ont été utilisées pour évaluer la qualité de la segmentation : 1. Indice de Jaccard : pour évaluer la similarité entre les résultats de segmentation du réseau et les annotations manuelles. 2. Distance de Hausdorff : pour évaluer la précision de la segmentation au niveau des contours. 3. Fonction d’activation (AF) : pour évaluer l’activation simulée des fibres nerveuses.
Principaux résultats de recherche
- Précision de segmentation : Le réseau HardNet amélioré a montré d’excellentes performances de segmentation, avec un indice de Jaccard de 0,840 et une distance de Hausdorff de 179 μm, surpassant d’autres architectures courantes comme ResNet et VGG.
- Efficacité du transfert d’apprentissage : Le transfert d’apprentissage a considérablement amélioré la généralisation du réseau sur de nouvelles données, en particulier lorsque les régions anatomiques diffèrent, comme lors du passage de la région lombo-sacrée à la région cervicale.
- Programme de nettoyage automatique : Le programme de nettoyage automatique a encore amélioré la continuité et la cohérence de la segmentation, garantissant l’exactitude anatomique du modèle.
Signification de la recherche
Le pipeline de segmentation automatique d’images de la moelle épinière basé sur les CNN développé dans cet article améliore considérablement l’efficacité et la précision de la segmentation, réduit le besoin d’intervention manuelle et offre une plus grande cohérence que la segmentation manuelle traditionnelle, favorisant ainsi l’élaboration de plans de traitement SCS personnalisés. De plus, ce pipeline a un potentiel d’application étendu dans d’autres domaines de segmentation d’images médicales.
Orientations futures de la recherche
- Augmenter la diversité et la quantité des données d’entraînement pour renforcer la généralisation du réseau.
- Effectuer une validation supplémentaire sur des données IRM de moelle épinière humaine post-mortem pour garantir la faisabilité clinique.
- Explorer d’autres techniques d’augmentation de données et de réseaux antagonistes génératifs (GAN) pour synthétiser davantage de données d’entraînement de haute qualité.
Conclusion
Cet article présente un pipeline automatisé de segmentation d’images IRM de la moelle épinière basé sur les CNN, dont la précision de segmentation est améliorée grâce à diverses techniques de prétraitement d’images et d’augmentation de données. Le transfert d’apprentissage et le programme de nettoyage automatique renforcent encore la polyvalence du modèle, préparant le terrain pour une application clinique de la stimulation personnalisée de la moelle épinière. Des recherches futures impliquant davantage de données et des techniques plus avancées pourraient encore améliorer la généralisation et les performances pratiques de ce pipeline.